Meta, la società madre di Facebook e Instagram, ha presentato oggi importanti avanzamenti nei suoi strumenti di intelligenza artificiale per la creazione e la modifica di contenuti, annunciando due innovazioni significative: Emu Edit per la modifica delle immagini ed Emu Video per la generazione di video.
Questi strumenti sono stati sviluppati come parte del progetto Expressive Media Universe (Emu), che è stato presentato a settembre. Insieme, queste nuove funzionalità di intelligenza artificiale per la creazione di contenuti promettono di offrire un’esperienza più intuitiva e creativa per gli utenti delle app social di Meta, come Facebook e Instagram.
La prima innovazione, denominata Emu Edit, mira a fornire agli utenti un controllo dettagliato sulla modifica delle immagini. Questo strumento introduce un approccio unico alla manipolazione delle immagini, in cui gli utenti inseriscono istruzioni basate su testo per apportare modifiche alle immagini, in modo simile alla funzionalità “riempimento generativo” offerta da Adobe Photoshop.
Emu Edit è in grado di eseguire una vasta gamma di operazioni di modifica, tra cui modifiche locali e globali, aggiunta o rimozione di sfondi, modifiche di colore e geometria, rilevamento di oggetti e segmentazione. È importante notare che Emu Edit limita le modifiche solo alle aree rilevanti per la richiesta dell’utente, preservando i pixel non coinvolti.
I ricercatori di Meta hanno sottolineato: “L’obiettivo principale non dovrebbe essere solo quello di produrre un’immagine credibile, ma piuttosto il modello dovrebbe concentrarsi sull’alterazione precisa solo dei pixel rilevanti per la richiesta di modifica”.
Emu Edit è stato addestrato su un vasto dataset composto da 10 milioni di campioni sintetizzati, il che gli permette di produrre risultati di alta qualità in termini di fedeltà alle istruzioni e qualità dell’immagine. Ad esempio, un utente può inserire il testo “Aloha!” da aggiungere a un’immagine di un berretto da baseball, e Emu Edit eseguirà questa operazione senza modificare il berretto stesso. Puoi approfondire la ricerca completa qui.
Oltre alla modifica delle immagini, il team di intelligenza artificiale di Meta ha lavorato anche per migliorare la generazione di video. Emu Video, basato su modelli di diffusione, offre un metodo semplice per la generazione di testo in video, consentendo l’input di vari formati, tra cui solo testo, solo immagini o entrambi.
Il processo di generazione del video prevede la creazione di un’immagine basata su un messaggio di testo, seguita dalla creazione di un video basato su quell’immagine e un altro messaggio di testo. Se sei interessato a provare questo nuovo strumento di editing video di Emu, puoi sperimentare la demo live qui. Puoi anche leggere la ricerca completa qui.
Questi progressi promettono di trasformare il modo in cui gli utenti interagiscono con le loro immagini e video sulle piattaforme di social media. Gli utenti potranno creare adesivi animati personalizzati, GIF o modificare le loro foto senza dover utilizzare strumenti complessi come Photoshop. Tuttavia, è importante notare che questi strumenti sono ancora in fase di sviluppo, e non ci sono informazioni ufficiali sulla data di disponibilità su piattaforme come Facebook e Instagram.
Per Meta, gli strumenti basati su Emu rappresentano una nuova frontiera nell’intelligenza artificiale generativa, che si aggiunge alle iniziative esistenti come Make-A-Video e il generatore di immagini AI DALL-E. Con il costante spingersi oltre i limiti dell’intelligenza artificiale assistita, l’obiettivo di Meta è fornire funzionalità intuitive che espandano le possibilità creative per gli utenti comuni.
Le implementazioni seguono la strategia sociale di Meta
Le implementazioni di Emu Video ed Emu Edit sono in linea con la strategia di Meta per promuovere l’engagement all’interno della sua famiglia di app. Consentendo la modifica e la creazione direttamente sulla piattaforma, Meta cerca di coinvolgere ulteriormente gli utenti nel suo ecosistema sociale.
Tuttavia, nonostante queste nuove funzionalità promettano una maggiore creatività, rimangono aperte alcune questioni etiche legate all’IA e alla supervisione dei contenuti. Come per altri modelli generativi, l’uso responsabile dell’Emu richiederà una supervisione per prevenire potenziali abusi. Meta ha dichiarato che la sicurezza rimane una priorità fondamentale, considerando l’accelerato sviluppo dell’IA generativa.
Per il momento, Emu Video ed Emu Edit sono ancora in fase di sviluppo, senza una data di rilascio ufficiale. Tuttavia, la ricerca attiva sull’IA generativa di Meta apre la strada a esperienze di social media sempre più innovative. Con l’avanzare della sintesi basata sull’intelligenza artificiale, un giorno gli utenti potrebbero creare contenuti di livello professionale con la stessa semplicità con cui inviano un messaggio di testo.