Generare disegni di scarpe con l’apprendimento automatico

Scarpe. Aspetta cosa? Pensavo che si sarebbe trattato di apprendimento automatico! Bene lo è. Se andassi su Amazon, quante scarpe troveresti? Probabilmente molto vero? Ma c’è molta varietà in loro? Almeno in termini di sneaker, molti sembrano abbastanza simili. È tempo per alcuni nuovi progetti. Dobbiamo evolversi, e se potessimo generare i nostri modelli di scarpe con le macchine …


Dati. I grandi rivenditori hanno un sacco di scarpe in vendita – Zappos e Amazon hanno entrambi migliaia di foto delle loro scarpe sui loro siti web. Così ho scansionato sul web quelle foto e le ho archiviate sul mio computer, principalmente per scarpe da corsa Nike vendute su Amazon. Ho scritto del codice per raschiare queste immagini. Fortunatamente erano già stati ritagliati a 224 pixel per 224 pixel (che è la dimensione necessaria per inserirli nel modello). Ma che tipo di architettura di machine learning genera cose invece di cercare modelli? La risposta alla tua domanda è affascinante …
Reti contraddittorie generative. Un’innovazione relativamente nuova nel campo del deep learning è la Generative Adversarial Network (GAN). I GAN utilizzano due reti diverse, una che genera immagini di ciò che pensa siano le scarpe (questo si chiama generatore) e un’altra che cerca di distinguere tra scarpe false e scarpe reali dal set di dati (questo si chiama discriminatore). Pensala come una guerra fredda tra queste reti, tranne per il fatto che stanno cercando di superare in astuzia l’un l’altro, non di armarsi a vicenda. Una volta che il discriminatore fondamentalmente non è in grado di dire la differenza tra le immagini generate e le immagini reali, il modello è convergente.

Una rete contraddittoria generativa.
Modello di apprendimento profondo. La rete neurale che ho creato era fortemente basata sul progetto Pokemon GAN di Siraj Raval , dove ha usato i GAN per generare nuovi Pokemon. Ho modificato il codice per lavorare con i miei dati sulle scarpe e ho addestrato il modello per 500 epoche sulle GPU di Amazon Web Services. Il risultato è stato piuttosto interessante …

Dai un’occhiata a questi calci freschi!
Risultati. Ho avuto il modello in uscita la sua immagine generata per ogni epoca per vedere i suoi progressi durante l’allenamento. È iniziato principalmente come rumore, con pixel colorati casuali che riempivano lo schermo, ma gradualmente ha preso la forma di una scarpa e ha ottenuto colori diversi per assomigliare meglio a una scarpa. Ho trovato interessante che alcune delle scarpe avessero il logo Nike, probabilmente riflettendo come la maggior parte delle immagini di allenamento nel set di dati fossero scarpe da corsa Nike.
Che cosa significa questo? Questo progetto mostra come l’apprendimento automatico può essere utilizzato al di fuori della semplice ricerca di schemi in un mucchio di dati. La sua capacità di generare nuove immagini offre opportunità di utilizzo in grandi settori (ad esempio moda, prodotti farmaceutici, ecc.). Con alcuni miglioramenti e una maggiore formazione, questi modelli possono essere estremamente potenti e possono essere in grado di creare modelli di scarpe per l’applicazione nel mondo reale; le aziende di moda potrebbero essere in grado di utilizzare i GAN per creare fantastici nuovi design alla moda.
Gli stilisti potrebbero perdere il lavoro alle macchine in futuro …

Jerry Wei

Di ihal