Uni-AdGen: un modello AI che genera immagini e testi pubblicitari personalizzati in un unico processo

La personalizzazione pubblicitaria rappresenta una delle aree più attive nello sviluppo dell’intelligenza artificiale applicata al marketing digitale. Nonostante i progressi degli ultimi anni, la maggior parte delle soluzioni continua a trattare separatamente la generazione delle immagini e quella dei testi pubblicitari, affidandosi inoltre a dati storici come il click-through rate per stimare le preferenze degli utenti. Questo approccio può risultare efficace per individuare tendenze generali, ma spesso fatica a cogliere le caratteristiche e gli interessi specifici dei singoli consumatori.

Per affrontare questo limite, un gruppo di ricercatori ha presentato “Design Your Ad: Personalized Advertising Image and Text Generation with Unified Autoregressive Models”, uno studio che introduce Uni-AdGen, un sistema progettato per generare contemporaneamente immagini e testi pubblicitari personalizzati attraverso un unico modello autoregressivo multimodale.

L’idea alla base della ricerca è che gli elementi visuali e testuali di una pubblicità non debbano essere creati come componenti indipendenti. In una campagna efficace, infatti, immagini e messaggi lavorano insieme per trasmettere un contenuto coerente e rilevante per il destinatario. Uni-AdGen cerca quindi di apprendere questa relazione generando entrambe le componenti all’interno dello stesso processo, utilizzando informazioni relative al prodotto e alle preferenze dell’utente.

Uno degli aspetti più interessanti del lavoro riguarda il sistema di comprensione delle preferenze individuali. I ricercatori evidenziano come i dati disponibili sugli utenti siano spesso rumorosi, incompleti o distribuiti tra fonti differenti. Per questo motivo il modello utilizza un meccanismo definito “coarse-to-fine”, che analizza progressivamente i comportamenti storici e gli interessi degli utenti per costruire una rappresentazione più accurata delle loro preferenze. Questa informazione viene poi utilizzata durante la generazione della creatività pubblicitaria.

Lo studio affronta anche una problematica tipica dei sistemi di generazione visuale: la corretta integrazione del prodotto all’interno dell’immagine finale. Per migliorare questo aspetto, Uni-AdGen introduce un modulo dedicato alla percezione del soggetto principale, con l’obiettivo di preservare l’identità del prodotto e inserirlo in contesti coerenti con il messaggio pubblicitario generato.

Per supportare la ricerca, gli autori hanno inoltre realizzato PAd1M, descritto come il primo dataset su larga scala dedicato alla generazione personalizzata di annunci pubblicitari multimodali. Il dataset contiene informazioni che consentono di addestrare e valutare sistemi capaci di produrre simultaneamente immagini e testi adattati alle preferenze degli utenti.

Un altro contributo del lavoro riguarda la valutazione delle creatività generate. Oltre alle metriche tradizionali, il team ha sviluppato Product Background Similarity (PBS), una misura progettata per verificare la coerenza tra il prodotto pubblicizzato e l’ambiente in cui viene inserito. L’obiettivo è fornire un criterio più accurato per misurare la qualità delle immagini pubblicitarie generate dall’intelligenza artificiale.

Secondo i risultati riportati nello studio, Uni-AdGen supera le soluzioni esistenti in diversi benchmark sia per la qualità delle immagini sia per la pertinenza dei testi generati. I test mostrano inoltre una migliore capacità di adattare i contenuti alle preferenze individuali degli utenti, mantenendo al tempo stesso la coerenza tra le componenti visuali e testuali della pubblicità.

La ricerca evidenzia come i modelli multimodali stiano evolvendo da semplici strumenti di generazione di contenuti a sistemi capaci di costruire campagne pubblicitarie complete e personalizzate. L’integrazione in un unico modello della comprensione delle preferenze utente, della generazione di immagini e della creazione dei messaggi testuali rappresenta un passo significativo verso forme di advertising sempre più automatizzate e adattive.

Uni-AdGen: un modello AI che genera immagini e testi pubblicitari personalizzati in un unico processo

DiFantasy

Di Fantasy

Articoli correlati

Perplexity presenta un sistema di inferenza ibrida che combina elaborazione locale e cloud

Microsoft presenta Surface RTX Spark Dev Box per eseguire modelli AI avanzati in locale

NVIDIA Cosmos 3, modello fondativo aperto che unisce ragionamento visivo, simulazione del mondo e generazione di azioni per l’AI fisica

Ultimi Post

Perplexity presenta un sistema di inferenza ibrida che combina elaborazione locale e cloud

Microsoft presenta Surface RTX Spark Dev Box per eseguire modelli AI avanzati in locale

NVIDIA Cosmos 3, modello fondativo aperto che unisce ragionamento visivo, simulazione del mondo e generazione di azioni per l’AI fisica

Anthropic valuta l’accesso di ENISA UE a Claude Mythos, il modello AI specializzato nella cybersecurity