TechCrunch ha recentemente discusso di un problema che affligge l’intelligenza artificiale (IA) utilizzata per generare immagini: gli errori frequenti di ortografia nelle parole. Anche se alcune IA, come ‘Idiogram’, ‘Dali’ e ‘Stable Diffusion’, sembrano essere in cima a questo settore, ancora non sono perfette.
Per esempio, quando l’IA genera parole, come “Hello”, potrebbe produrre risultati come “HeLIo” o “HEELLLLOOOO”. Questo diventa un problema serio se le immagini generate vengono utilizzate per scopi commerciali.
Gli esperti spiegano che questo problema deriva dal funzionamento stesso delle IA generative. Questi modelli tendono a eccellere nella creazione di oggetti come auto o volti umani, ma hanno difficoltà con dettagli più piccoli come le dita o la scrittura.
Il problema è che le IA imparano dai dati di addestramento, ma non comprendono completamente le regole dell’ortografia o del conteggio delle dita.
Per risolvere questo problema, gli sviluppatori stanno aumentando i set di dati con modelli di addestramento specializzati, ma non è un compito facile.
Alcuni modelli, come Adobe Firefly, evitano del tutto di generare testo nelle immagini, emettendo solo segni bianchi quando viene specificata la tipografia. Tuttavia, questo può essere aggirato inserendo informazioni sufficienti nel prompt.
Il fondatore Hagu ha sottolineato che, sebbene l’intelligenza artificiale generativa stia migliorando rapidamente, ci saranno sempre problemi, poiché la capacità tecnologica ha i suoi limiti.
In sostanza, mentre l’IA sta facendo passi avanti, rimane ancora un lungo cammino da percorrere prima che diventi perfetta.