Immagine AI

ByteDance, la società madre di TikTok, ha recentemente lanciato Seedream 3.0, un modello avanzato di generazione di immagini che promette di superare le capacità di GPT-4o di OpenAI e Imagen 3 di Google. Questo nuovo modello si distingue per la sua capacità di generare immagini ad alta risoluzione fino a 2K, con una qualità visiva superiore e una gestione avanzata del testo, specialmente in cinese, rispetto ai suoi concorrenti. ​

Seedream 3.0 rappresenta un significativo miglioramento rispetto alla versione precedente, Seedream 2.0. Il modello è stato addestrato su un dataset ampliato di circa il 100%, utilizzando un meccanismo di campionamento dinamico. La fase di pre-addestramento ha incorporato tecniche avanzate come l’addestramento a risoluzione mista, RoPE cross-modale, perdita di allineamento delle rappresentazioni e campionamento consapevole del tempo per migliorare la scalabilità e l’allineamento visivo-linguistico. ​

In termini di qualità dell’immagine, Seedream 3.0 ha ottenuto punteggi elevati in benchmark come l’Artificial Analysis Arena, posizionandosi vicino a GPT-4o e superando Imagen 3. Il modello ha mostrato prestazioni eccezionali nella gestione del testo denso, con un tasso di disponibilità del 94% sia per il cinese che per l’inglese, affrontando con successo la generazione di caratteri cinesi complessi. ​

Oltre alla generazione di immagini, ByteDance ha introdotto SeedEdit, uno strumento derivato da Seedream che consente l’editing sia delle immagini che del testo all’interno delle immagini generate. Secondo le affermazioni dell’azienda, SeedEdit offre una migliore conservazione dell’identità e una maggiore aderenza ai prompt rispetto a GPT-4o e Gemini 2.0, sebbene presenti sfide in scenari di editing più complessi. ​

Con Seedream 3.0, ByteDance mira a stabilire nuovi standard nel campo dell’IA generativa per immagini, offrendo un modello che non solo genera immagini di alta qualità ma gestisce anche in modo efficace il testo, un aspetto cruciale per applicazioni in lingue come il cinese. L’integrazione di Seedream 3.0 in piattaforme come Doubao e Jimeng potrebbe rivoluzionare i flussi di lavoro creativi, migliorando l’efficienza e la qualità dei contenuti generati.

Di Fantasy