La startup Stability AI ha presentato il suo nuovo modello di intelligenza artificiale generativa da testo a immagine, chiamato DeepFloyd IF, che non utilizza il noto modello di linguaggio Stable Diffusion (LLM) ma si basa sul più flessibile modello T5-XXL-1.1. Questo modello offre a DeepFloyd IF maggiori funzionalità e prestazioni migliori rispetto alla versione standard di Stable Diffusion.
DeepFloyd IF è in grado di generare testo leggibile in diverse forme e caratteri, nonché immagini fotorealistiche personalizzabili, ridimensionandole e applicando un rumore delicato per alterare lo stile e completare la modifica senza ripetuti ritocchi.
Secondo Stability AI, il modello è un’opzione all’avanguardia per la generazione di testo in immagine ed è stato rilasciato sotto una licenza non commerciale e ammissibile alla ricerca. Inoltre, è progettato per consentire ai laboratori di ricerca di esaminare e sperimentare approcci avanzati di generazione di testo in immagine.
DeepFloyd IF sembra essere il seme di una versione open source del modello Stable Diffusion XL (SDXL), incentrato sulle aziende di Stability AI, presentato il mese scorso. L’espansione della ricerca sull’IA generativa di Stability è stata alimentata dai 101 milioni di dollari raccolti lo scorso anno. Inoltre, la società ha acquisito la società dietro il servizio di manipolazione delle immagini AI Clipdrop e ha collaborato con la piattaforma digitale da collezione Revel.xyz per rilasciare uno strumento di immagine in animazione chiamato Animai.