In che modo le piccole e medie imprese possono trarre vantaggio dall’IA da testo a immagine
Avere la possibilità di provare DALL-E 2 , il nuovo sistema di intelligenza artificiale di OpenAI in grado di creare immagini realistiche dal linguaggio naturale, è stato davvero straordinario.
Non c’è dubbio che il sistema sia ancora agli inizi, ma è chiaro che la tecnologia si sta muovendo rapidamente e stiamo già iniziando a vedere modelli da testo a immagine migliorati. Imagen di Google Brain , che può generare immagini fotorealistiche di una scena con una descrizione testuale, e Make-A – Scene di Meta , che consente agli utenti di disegnare uno schizzo digitale a mano libera per accompagnare un prompt di testo, sono entrambi esempi promettenti.
Presentazione Perché rendere operativa la mesh di dati è fondamentale per operare nel cloud_
Questa tecnologia non è solo per le grandi aziende tecnologiche. Ci sono molti modi in cui le piccole e medie imprese possono trarre vantaggio dalla tecnologia text-to-image oggi.
Campagne di marketing con strumenti come DALL-E 2
In media, si consiglia alle piccole imprese di spendere il 7–8% delle loro entrate lorde in marketing. Eppure, molti stanno spendendo solo il 3-5%. Strumenti come DALL-E 2 possono consentire agli imprenditori di superare il loro peso anche se non hanno il lusso di assumere talenti per produrre grafiche personalizzabili con il marchio.
Come si suol dire, un’immagine vale più di mille parole. Man mano che DALL-E 2 e altri sistemi di conversione da testo a immagine diventano sempre più ampiamente disponibili, è logico che i professionisti del marketing inizino a utilizzarli per le loro campagne.
Prendi, ad esempio, un marchio che vende pesce fresco. Sebbene abbia senso includere immagini allettanti nelle sue e-mail, non c’è alcun vantaggio reale nel fare i propri servizi fotografici rispetto all’utilizzo di foto stock. Gli abbonamenti ai cataloghi di foto d’archivio per uso commerciale possono facilmente costare centinaia di dollari al mese, il che è difficile da giustificare per i marchi più piccoli.
Entra in DALL-E 2. Il modello consente ai professionisti del marketing di combinare la creatività di assumere un grafico interno con potenziali risparmi sui prezzi. Ecco, ad esempio, cosa produce DALL-E 2 quando si chiede “una foto che ritrae un salmone appetitoso con fette di limone”.
Anche se queste immagini fanno davvero venire l’acquolina in bocca, cosa succede quando l’offerta di salmone diminuisce inaspettatamente e la nostra offerta di questa settimana si sposta dal salmone al merluzzo? Per le piccole imprese che hanno bisogno di cambiare rotta in un attimo, la capacità di generare nuove immagini in 30 secondi non ha prezzo.
Creazione grafica di DALL-E 2
DALL-E 2 è entrato nella coscienza popolare non per la sua capacità di rispecchiare fedelmente il mondo, ma per la sua capacità di creare immagini meravigliosamente stilizzate.
Considera questo acquerello di un panda che indossa un cappello. L’immagine è giocosa, ben strutturata e non esiste in nessun catalogo di foto d’archivio. Questo è il motivo per cui DALL-E 2 è entusiasmante: apre nuove opportunità, soprattutto per le piccole imprese.
Il successo di strumenti come DALL-E 2 potrebbe essere scoraggiante per i designer là fuori preoccupati per l’intelligenza artificiale che automatizza i loro ruoli, soprattutto perché alcuni esperti prevedono che il 99,9% dei contenuti online sarà generato dall’IA entro il 2030. Ma crediamo che DALL-E 2 non lo farà t sostituire eventuali lavori; diventerà invece una parte del kit di strumenti e delle competenze di un marketer.
La qualità dell’output di DALL-E 2 varia notevolmente a seconda dei prompt inseriti. La generazione di un buon prompt è un processo molto creativo, simile alla scrittura della copia stessa. Se il futuro includerà i marketer in ruoli ibridi che utilizzano questi strumenti come fonte di ispirazione, allora questa diventerà sempre più un’abilità di dominio.
DALL-E 2: Dipingere
Una delle funzionalità più interessanti offerte da DALL-E 2 è la pittura automatica. Pensalo come se avesse una bacchetta magica che i marketer possono agitare per cambiare le immagini come vogliono.
Questo è meglio visto attraverso l’esempio. Qui, a DALL-E 2 è stata data la prima immagine e gli è stato detto di inserire un corgi in una posizione specifica. Il modello ha compreso il contesto dell’immagine abbastanza bene da capire che gli è stato chiesto di rappresentare il cane all’interno di un dipinto ed è stato in grado di comporre in uno stile che corrispondeva.
Questa caratteristica affascinante ha molto valore, soprattutto per i marchi che vogliono catturare i loro prodotti in luoghi diversi o scenari unici. Immagina di posizionare il tuo prodotto in sfondi che non puoi visitare o di vedere come sarebbe stato George Washington sorseggiando una Coca-Cola.
DALL-E 2 può cambiare notevolmente il gioco per i marketer in cui saranno più limitati dalla loro creatività che dal tempo e dal budget.
Limitazioni
Sebbene vi sia motivo di essere entusiasti del futuro, la tecnologia attuale ha ancora dei limiti. Fa fatica a generare persone fotorealistiche e spesso non riesce a generare testo coerente. Inoltre, ci sono state alcune critiche significative a DALL-E 2 sulla questione del bias . Ad esempio, quando è stato incaricato di generare il “ritratto di una persona intelligente”, DALL-E Mini, un’implementazione open source a basso costo di DALL-E 2, ha generato nove immagini di uomini bianchi in abiti formali.
OpenAI ha recentemente rilasciato un aggiornamento volto a mitigare alcuni di questi problemi di bias, ma resta da vedere se saranno veramente risolti. Nel frattempo, i professionisti del marketing che utilizzano questi strumenti dovranno fare attenzione a evitare di propagare involontariamente pregiudizi.
Riassumendo
Quindi vorremmo DALL-E 2, nella sua forma attuale, come strumento nella nostra cassetta degli attrezzi di marketing? Assolutamente, e per molti scopi: immagini che possono essere utilizzate come generate, per dare spunti per ulteriori modifiche; aiutare il brainstorming; trasmettere idee ad artisti grafici; eseguire test A/B efficienti su creatività; e per creare fantastiche immagini accattivanti che oggi potrebbero essere realizzate solo dagli artisti. Nonostante i suoi limiti, ci sono anche opportunità.
Negli ultimi sei mesi abbiamo assistito a un crescente interesse per la rivoluzionaria tecnologia text-to-image. Man mano che la tecnologia continua a muoversi rapidamente, continueranno a emergere modelli migliori e più migliorati e i casi d’uso per i marchi aumenteranno solo.
di Robert Huselid e Tom Dinitz
Robert Huselid e Tom Dinitz sono data scientist presso Klaviyo , una piattaforma unificata per i clienti per e-mail, SMS e altro, che consente ai marchi online di possedere i propri dati e crescere alle proprie condizioni.