OpenAI offre una prima occhiata all’API DALL-E, mostra il caso d’uso da testo a immagine 

L’API DALL-E non sarà annunciata ufficialmente fino alla fine dell’autunno, secondo OpenAI, ma oggi l’azienda ha condiviso i dettagli su un cliente che già sfrutta l’API DALL-E per uno specifico caso d’uso aziendale.  

Cala , una startup con sede a New York City che si autodefinisce il “primo sistema operativo al mondo per la moda”, offre una piattaforma digitale (inclusa un’app mobile lanciata a marzo ) che consente ai creatori di progettare e produrre linee di abbigliamento, unificando il processo da ideazione del prodotto attraverso l’evasione dell’ordine. Con l’aggiunta degli strumenti di generazione da testo a immagine basati su DALL-E , gli utenti possono generare nuove idee di progettazione visiva da descrizioni di testo naturali o immagini di riferimento caricate, che secondo l’azienda sono funzionalità uniche nel suo genere per l’industria della moda . 

 
Presentazione Perché rendere operativa la mesh di dati è fondamentale per operare nel cloud_
“Dal momento in cui abbiamo visto la nascita di DALL-E , sapevamo che questo era davvero perfetto per la nostra attività e il modo in cui lavoriamo”, ha affermato Dylan Pyle, CTO di Cala, che ha aggiunto che l’implementazione di DALL-E L’API è avvenuta solo nelle ultime settimane. “Lo vediamo davvero come un potenziamento dei designer umani: ti stiamo aiutando a trasformare queste idee in esplorazioni abbastanza dettagliate di ciò che stai cercando di realizzare… semplificando e rendendo l’intero processo più veloce, più efficace e più efficiente.” 

Luke Miller, product manager dell’API DALL-E presso OpenAI, ha affermato che la società di ricerca ha già una vasta base di sviluppatori che utilizzano le sue API , quindi ha contattato per offrire l’API DALL-E ad aziende specifiche. 

 

“È stato un po’ opportunistico, perché troviamo casi d’uso creativi e interessanti mentre testiamo il prodotto”, ha affermato. “Il nostro team era super entusiasta di lavorare con Cala su questo caso d’uso molto specifico, potenziando in qualche modo il loro processo creativo e trasformandolo in una vera applicazione aziendale”. 

Come Cala utilizza l’API DALL-E
 
Per utilizzare gli strumenti basati su DALL-E, un utente seleziona tra dozzine di modelli di prodotto, come una felpa con cappuccio, un vestito o una giacca, e aggiunge termini come “scuro, delicato e velluto” in una sezione di aggettivi e frasi come “cucito patch logo” in una sezione per finiture e caratteristiche. 

Cala genera quindi sei progetti di prodotti di esempio. L’utente può continuare a rigenerare i progetti in base al prompt originale o continuare a modificare ulteriormente un determinato progetto. I creatori possono anche caricare i propri design e DALL-E restituirà sei immagini con variazioni leggermente diverse. 

 
Pyle ha sottolineato che Cala vede l’API DALL-E come un modo per aiutare a potenziare il processo di ispirazione creativa, indipendentemente dal fatto che il creatore sia un designer esperto o meno. “Siamo davvero impegnati a prendere il design e trasformarlo in realtà, e se riusciamo a rendere più facile arrivare a quel momento di ispirazione, è fantastico per noi”. 

Miller ha aggiunto che l’API DALL-E consente agli sviluppatori di utilizzare la tecnologia DALL-E e creare soluzioni personalizzate specifiche per le loro applicazioni. 

“Vogliamo creare uno strumento che sia sufficientemente flessibile da consentire loro di creare soluzioni specifiche per le esigenze dei clienti”, ha affermato. “Quindi, in questo caso, [si tratta] di consentire agli utenti finali di elaborare idee e variazioni, prendere un’immagine e generarne un sacco di versioni diverse – per modificare e adattare le cose alle loro esigenze specifiche e lasciare che la loro creatività si svolga con esso .” 

Guardrail intorno ai risultati rapidi
 
Gli sviluppatori di Cala non consentono risultati DALL-E completamente aperti, ma hanno messo a punto dove gli input potrebbero portare gli utenti in ogni categoria di prodotto, ha affermato Pyle.  

“Ovviamente il modello che genera le immagini alla fine della giornata è DALL-E… ma li stiamo trasformando in suggerimenti che abbiamo sviluppato per ogni categoria di prodotto per orientare i risultati DALL-E nel modo che riteniamo abbia più senso ,” Egli ha detto. “Siamo rimasti sbalorditi da quanto sia facile… devi ancora avere quel tipo di creatività che guida gli input e interpreta gli output in modo sensato. Ma con solo un po’ di direzione, puoi ottenere dei risultati davvero grandiosi. Questo è scattato per il nostro team quasi immediatamente”. 

Alla domanda se gli utenti di Cala possono utilizzare prompt come nomi di designer o loghi popolari, Miller ha risposto che ci sono barriere intorno al modo in cui gli utenti possono inserire i prompt DALL-E e che l’API segue la politica sui contenuti OpenAI, che vieta i contenuti relativi a una varietà di categorie tra cui odio, molestie, violenza, sessuali e politiche. 

 
“È una risorsa preziosa per risolvere tutte queste domande sul lato della moderazione e della sicurezza e passarle ai nostri sviluppatori in modo che siano integrate nell’esperienza”, ha affermato. L’implementazione di Cala è “un caso d’uso molto specifico che vincola lo spazio e riguarda specificamente il processo creativo”. 

“Non siamo certamente interessati a incoraggiare o abilitare approcci del genere”, ha aggiunto Pyle. “Stiamo cercando di concentrarci sul tipo di elementi di design che rendono uniche le tue idee”. 

Di ihal