“Perché Meta sta distaccandosi dai modelli di linguaggio di livello inferiore (LLM)? Con Google che ora ha Bard per competere con ChatGPT, Meta sembra ancora impegnata a recuperare dai suoi insuccessi passati.”
I Modelli di Linguaggio di Grandi Dimensioni (LLM) e i chatbot hanno dominato internet dallo scorso anno, grazie alla release di ChatGPT da parte di OpenAI, supportato da Microsoft, alimentato da GPT-3.5. In risposta, Google ha attentamente valutato la situazione prima di rilasciare parzialmente il suo chatbot sperimentale Bard. Anche il colosso tecnologico cinese Baidu non vuole essere da meno e ha in programma di competere con il suo Ernie Bot, basato sul modello di linguaggio di grandi dimensioni ERNIE 3.0, previsto per essere lanciato a marzo di quest’anno. Ci aspettano altre novità nei prossimi mesi.
Tuttavia, un’azienda tecnologica sembra evitare lo sviluppo di robot LLM e questa azienda è Meta. Sorprendentemente, potrebbe essere l’unica azienda che non ha ancora aderito alla tendenza dei robot LLM, a causa dei suoi fallimenti nel passato. Nel giugno 2022, Meta ha reso open source il suo LLM OPT-66B e ha lanciato uno dei primi chatbot basati su LLM: BlenderBot 3, che ha suscitato molto interesse quando è uscito per la prima volta ad agosto 2022. Sebbene fosse disponibile solo negli Stati Uniti, Twitter e Reddit sono stati invasi da screenshot delle conversazioni avvincenti tra le persone e il conversatore AI.
Tuttavia, in un giorno o due, il bot di successo ha improvvisamente iniziato a fare una brutta figura. BlenderBot ha iniziato a vomitare commenti razzisti e ha persino messo in dubbio le strategie aziendali di Mark Zuckerberg, etichettandole come “non etiche”. Non c’era alcun pentimento. Questo ha purtroppo portato le persone a perdere la fiducia nel chatbot e Meta ha dovuto affrontare un declino nel numero di utenti.
Questo però non ha impedito all’azienda di sperimentare un altro modello basato su LLM. Questa volta, con un’applicazione più specifica, Galactica è stato creato per la ricerca scientifica e lanciato solo due settimane prima del lancio di ChatGPT. Alimentato da migliaia di documenti di ricerca, il modello avrebbe dovuto aiutare ricercatori e scienziati nella loro attività di scoperta. Ma anche in questo caso, il modello ha iniziato a produrre risultati insensati e alla fine è stato chiuso.
Nonostante i recenti insucessi, Meta sembra essere ancora decisa a competere con i grandi giocatori del settore dell’intelligenza artificiale come ChatGPT e Bard. Tuttavia, c’è stata una svolta nelle strategie dell’azienda. Secondo Yann LeCun, capo dell’IA di Meta, l’azienda sta concentrando i suoi sforzi sul perfezionamento dei modelli di testo invece di tuffarsi nella attuale “onda dell’IA” dei chatbot. L’obiettivo è creare modelli affidabili e precisi che le persone possano utilizzare con fiducia. Questa è la più grande critica dei recenti chatbot, secondo LeCun, e Meta sta cercando di evitare questi errori.
Meta è stato un pioniere nell’IA per molto tempo. Zuckerberg ha investito miliardi di dollari dal 2013 per mantenere la sua posizione di leader nella corsa all’IA. L’assunzione di Yann LeCun è stata una mossa importante che ha dato nuove speranze all’azienda e ha portato Zuckerberg a investire ulteriormente nel campo dell’IA. Tuttavia, nell’era dell’IA generativa, e in particolare degli LLM, l’azienda sembra esitare a impegnarsi ulteriormente.
Inoltre, un altro fallimento da parte di Meta potrebbe lasciare una cicatrice permanente. Ad esempio, l’errore recente di Google durante la promozione del chatbot Bard alimentato da LaMDA all’evento AI “Live in Paris” ha costato alla società 100 miliardi di dollari. Meta non può permettersi di correre questo rischio.
La maggior parte dell’innovazione del team di intelligenza artificiale di Meta dal 2013 è stata dedicata alla loro attività pubblicitaria e alla rimozione della disinformazione dalla piattaforma. Adesso, però, l’azienda sta faticando a trasformare i propri modelli e algoritmi di intelligenza artificiale in prodotti concreti. Quando hanno provato per la prima volta con il loro sistema di riconoscimento facciale, alla fine sono stati costretti a spegnerlo a causa di problemi di privacy.
Secondo LeCun, Meta è stata da tempo criticata per aver diffuso informazioni false. Dopo gli errori recenti di BlenderBot e Galactica, la società vuole essere più cauta riguardo a ciò che pubblica per evitare di essere nuovamente accusata di commettere gli stessi errori. Mentre piccole aziende come OpenAI non avevano molto da perdere rilasciando tecnologia sperimentale nel mondo, non è lo stesso per Meta.
Andrew Ng, ricercatore sia del Google AI Labs che di Baidu, ha dichiarato che le grandi aziende tecnologiche sono tenute a uno standard elevato. Questo dà maggiore flessibilità e opportunità sperimentali alle aziende più piccole. Ecco perché Microsoft ha deciso di investire in una società separata per evitare rischi. E’ una questione di precauzione.
All’epoca del lancio di BlenderBot, LeCun aveva affermato di aver esteso lo stato dell’arte. Tuttavia, la società era molto preoccupata per la diffusione di disinformazione. Ora, secondo LeCun, non c’è “nulla di nuovo” in ChatGPT e la tecnologia si basa su quanto era già stato offerto da Meta e Google. Allo stesso tempo, ammette che anche i modelli linguistici hanno il loro valore.