MNC Fractal Analytics ha lanciato Kalaido.ai, il primo modello indiano di diffusione testo-immagine progettato per le lingue indiane. Utilizzando un vasto set di dati pubblici di 70 milioni di immagini e supportando 17 lingue indiane, tra cui hindi, kannada, tamil, telugu e sanscrito, Kalaido.ai promette di superare i concorrenti globali del 40% nella generazione di immagini dettagliate. Inoltre, riduce il tempo di iterazione del 50% migliorando la descrizione rapida e altri aspetti. Anche se non rende il codice open source, la versione beta sarà gratuita e si rivolgerà a settori come la pubblicità, il design grafico, il marketing sui social media e l’edtech.
L’approccio formativo efficiente di Kalaido.ai riduce al minimo i passaggi, risparmiando tempo, costi delle GPU e riducendo l’impronta di carbonio. Ha dimostrato di ridurre i costi per i marchi, ad esempio, riducendo del 79% i costi per la generazione dell’immagine di un marchio di zuppe. Nel settore dell’edtech, Kalaido.ai è stato in grado di generare contenuti corso di nove ore con solo due ore di riprese effettive, mentre il resto è stato creato tramite immagini.
Fractal esprime cautela nell’utilizzo di Kalaido.ai per prevenire usi impropri, filigrane sulle immagini e per rifiutare di elaborare messaggi di testo dannosi. Il modello può essere personalizzato in base alle esigenze del cliente. Ad esempio, è stato utilizzato insieme a una strategia di prompt basata sulle neuroscienze per creare prompt di 100 parole per un’altra multinazionale, mantenendo coerenza con le linee guida del marchio.
L’azienda ha recentemente introdotto Flyfish, una piattaforma di intelligenza artificiale generativa per le vendite digitali, che consente ai marchi di offrire esperienze di acquisto personalizzate e basate sui dati tramite consulenti di vendita AI intuitivi. Analizzando i modelli di acquisto dei clienti e le preferenze, i marchi possono creare rapidamente consulenti di vendita AI integrando i cataloghi di prodotti con i dati dei clienti.
Inoltre, Stability AI, un laboratorio di ricerca sull’intelligenza artificiale con sede a Londra, ha presentato in anteprima Stable Diffusion 3, un modello di conversione da testo a immagine più avanzato, con prestazioni migliorate nei suggerimenti multisoggetto, nella qualità dell’immagine e nell’ortografia. La suite di modelli Stable Diffusion 3 varia attualmente dai parametri 800M a 8B.