Il motivo degli errori di ortografia nelle immagini generate dall’Intelligenza Artificiale

DiFantasy

Mar 24, 2024

TechCrunch ha recentemente discusso di un problema che affligge l’intelligenza artificiale (IA) utilizzata per generare immagini: gli errori frequenti di ortografia nelle parole. Anche se alcune IA, come ‘Idiogram’, ‘Dali’ e ‘Stable Diffusion’, sembrano essere in cima a questo settore, ancora non sono perfette.

Per esempio, quando l’IA genera parole, come “Hello”, potrebbe produrre risultati come “HeLIo” o “HEELLLLOOOO”. Questo diventa un problema serio se le immagini generate vengono utilizzate per scopi commerciali.

Gli esperti spiegano che questo problema deriva dal funzionamento stesso delle IA generative. Questi modelli tendono a eccellere nella creazione di oggetti come auto o volti umani, ma hanno difficoltà con dettagli più piccoli come le dita o la scrittura.

Il problema è che le IA imparano dai dati di addestramento, ma non comprendono completamente le regole dell’ortografia o del conteggio delle dita.

Per risolvere questo problema, gli sviluppatori stanno aumentando i set di dati con modelli di addestramento specializzati, ma non è un compito facile.

Alcuni modelli, come Adobe Firefly, evitano del tutto di generare testo nelle immagini, emettendo solo segni bianchi quando viene specificata la tipografia. Tuttavia, questo può essere aggirato inserendo informazioni sufficienti nel prompt.

Il fondatore Hagu ha sottolineato che, sebbene l’intelligenza artificiale generativa stia migliorando rapidamente, ci saranno sempre problemi, poiché la capacità tecnologica ha i suoi limiti.

In sostanza, mentre l’IA sta facendo passi avanti, rimane ancora un lungo cammino da percorrere prima che diventi perfetta.

Il motivo degli errori di ortografia nelle immagini generate dall’Intelligenza Artificiale

DiFantasy

Di Fantasy

Articoli correlati

HUSH: l’AI che trasforma una foto panoramica in un modello 3D interattivo

Tencent lancia Hunyuan-A13B, LLM open source che unisce potenza ed efficienza

IBM prevede un futuro della cybersecurity dominato dall’intelligenza artificiale

You missed

HUSH: l’AI che trasforma una foto panoramica in un modello 3D interattivo

Tencent lancia Hunyuan-A13B, LLM open source che unisce potenza ed efficienza

IBM prevede un futuro della cybersecurity dominato dall’intelligenza artificiale

La partnership tra New Tune e il National Gugak Center per preservare e innovare la musica tradizionale coreana con l’IA