Il 2025 doveva segnare il consolidamento dell’era dell’intelligenza artificiale, con lanci che avrebbero riscritto il paradigma della creatività, dell’agency e della produttività digitale. Al contrario, moltissimi annunci – attesi con entusiasmo – si sono rivelati sotto le aspettative, non per colpa della tecnologia in sé, ma per la distanza fra la promessa e l’esperienza concreta.
Pensiamo innanzitutto al tanto acclamato GPT-5. OpenAI lo ha presentato come un salto epocale – “una Death Star dell’IA” come l’ha definito il CEO Altman – ma ben presto molti utenti lo hanno percepito come un taglio rispetto al passato, anziché un miglioramento: risposte più scabre, perdita di calore e personalità, lentezza e una sensazione di restrizione nelle risposte. La reazione è stata tempestiva: migliaia di utenti hanno firmato petizioni per ripristinare GPT-4 e modelli precedenti, e Altman stesso ha riconosciuto che qualcosa nel rollout non ha funzionato.
Allo stesso tempo, Meta Llama 4 ha deluso chi sperava in un modello “aperto e potente”. Invece, Llama 4 si è rivelato un compromesso: non un vero open source, bensì un modello con restrizioni d’uso. Nei benchmark tecnici non ha brillato — nelle prove di codifica poliglotta ha reso solo al 16% in alcuni test — e nei testi lunghi spesso è risultato peggiore di modelli più piccoli. L’impressione diffusa è che la comunicazione attorno al lancio avesse sovrastimato la capacità effettiva del modello.
In India, l’ideale patriottico di un modello “nazionale” con Sarvam-M ha incontrato difficoltà pratiche: pur rivendicato come modello ottimizzato per lingue indiane e con elevate prestazioni, nei primi giorni ha registrato poche centinaia di download. Gli utenti hanno lamentato superficialità rispetto a modelli internazionali come ChatGPT, mentre sui social la critica è stata aspra: il modello avrebbe promesso più di quanto potesse mantenere.
La disillusione non ha risparmiato nemmeno collaborazioni di largo respiro, come quella di Perplexity Pro con Airtel. Airtel aveva promesso ai propri clienti indiani un anno gratuito di accesso a Perplexity Pro, ma in realtà la versione “gratuita” attivata sotto il marchio Airtel avrebbe offerto capacità peggiori rispetto al servizio Pro vero: risposte lente, mancanza di citazioni, modelli ridotti. In molti casi è trapelata l’impressione che fosse un espediente marketing più che un’offerta onesta.
Anche Apple, pur da tempo annunciata come attore chiave nel campo dell’intelligenza artificiale “embedded”, non ha saputo incidere come sperato. Le sue iniziative di IA, come l’espansione di Siri attraverso email e note, non hanno dato risultati soddisfacenti. Addirittura è rimasto celebre un episodio in cui una funzione di riassunto generava notizie false assurde, costringendo Apple a ritrattare. Molti utenti hanno bollato l’offerta come “mediocre” rispetto alle aspettative costruite dal brand.
Il mondo delle applicazioni più “consumer” ha riservato flop divertenti e imbarazzanti allo stesso tempo. Taco Bell ha lanciato un sistema AI per gli ordini al drive-through, ma la macchina si è impantanata in loop: ha accettato migliaia di ordinazioni d’acqua, ricaricato prodotti doppi, fatto richieste strane da sola. Il caos ha fatto tornare l’intervento umano come pilastro indispensabile.
Nel campo video, esperimenti come Meta Vibes e Sora 2 hanno mostrato che anche tecnologie avanzate non bastano se l’esperienza utente è debole. Vibes, il feed video AI di Meta, è stato criticato per contenuti generati piatti, ripetitivi e privi di autenticità, proprio il contrario di ciò che si proclamava. Sora 2, app video di OpenAI, ha perso utenti rapidamente: bug, restrizioni creative, qualità incostante e una valutazione medio-bassa (2,9 stelle) hanno segnalato un prodotto che non reggeva le promesse.
Infine, Runway Gen-4, il generatore video tanto atteso dopo ritardi, ha incassato delusioni anche fra gli utenti premium: tempi di attesa lunghi, animazioni erratiche, freeze improvvisi, comportamenti critici in character rendering. Molti hanno preferito restare con Gen-3 Alpha Turbo, considerata più stabile.
Se il filo conduttore di questi casi è il contrasto fra marketing e realtà, l’insegnamento è chiaro: l’IA non è magia, e nel suo sviluppo contano i dettagli — ottimizzazione, robustezza, integrazione, esperienza utente. Le promesse altisonanti suscitano attenzione, ma sono le prestazioni concrete a fidelizzare. In un ambiente dove ogni lancio rischia l’iperbole, il 2025 ci ricorda che serve prudenza: le tecnologie avanzate devono dimostrare valore, non solo potenziale.