Durante l’evento Google I/O, Google ha presentato PaLM 2, un nuovo modello linguistico di ultima generazione. PaLM 2 rappresenta un notevole miglioramento rispetto al suo predecessore, PaLM, introducendo numerose nuove funzionalità che lo distinguono dal GPT-4 di OpenAI.
Uno dei principali vantaggi di PaLM 2 è la disponibilità di dimensioni più ridotte, come Gecko, Otter, Bison e Unicorn, che sono state appositamente ottimizzate per dispositivi con risorse di elaborazione limitate. Questi modelli più compatti consentono a PaLM 2 di essere utilizzato su un’ampia gamma di dispositivi e prodotti, compresi i dispositivi mobili che possono eseguire il modello leggero Gecko anche offline. Questa flessibilità nelle dimensioni dei modelli rende PaLM 2 molto accessibile e facilmente implementabile.
Google afferma che PaLM 2 dimostra una capacità di ragionamento superiore rispetto a GPT-4, in particolare nelle attività come WinoGrande e DROP, con un leggero vantaggio anche in ARC-C. Tuttavia, è importante notare che confrontare direttamente i due modelli può essere difficile a causa delle differenze nella presentazione dei risultati dei test. Inoltre, Google ha scelto di omettere alcuni confronti in cui PaLM 2 ha ottenuto risultati meno favorevoli, suscitando qualche dubbio sulla completezza della valutazione.
Per quanto riguarda le abilità matematiche, PaLM 2 mostra miglioramenti significativi secondo un documento di ricerca di Google. Sebbene le dimensioni esatte del modello più grande di PaLM 2, PaLM 2-L, rimangano sconosciute, Google ha dichiarato che è significativamente più piccolo rispetto ai 540 miliardi di parametri di PaLM. Ciò suggerisce che PaLM 2-L sia probabilmente più piccolo di GPT-3.5, ma sia comunque in grado di competere efficacemente con GPT-4, offrendo prestazioni notevoli in diverse attività.
Le nuove funzionalità di Bard lo rendono anche una scelta eccellente per la ricerca. Fornisce riepiloghi più concisi e un miglioramento nell’approvvigionamento delle informazioni. Gli utenti possono ora accedere rapidamente alle informazioni principali di un argomento e identificare facilmente quali parti della risposta corrispondono a fonti specifiche facendo clic sui tag numerici delle sezioni corrispondenti nelle fonti collegate. Questo risulta particolarmente utile per la ricerca e la scrittura di saggi che richiedono conoscenze specifiche e citazioni dettagliate. Questi aggiornamenti risolvono le limitazioni degli strumenti di intelligenza artificiale nella verifica delle informazioni del mondo reale e migliorano le capacità di ricerca di Bard.
Sebbene Google non abbia rivelato le dimensioni esatte dell’insieme di dati di addestramento di PaLM 2, l’azienda ha sottolineato un focus su matematica, logica, ragionamento e scienza. Il corpus di pre-training di PaLM 2 è composto da una vasta gamma di fonti, inclusi documenti web, libri, codice, materiale matematico e dati conversazionali. Inoltre, PaLM 2 è stato addestrato in oltre 100 lingue, migliorando la sua comprensione contestuale e le capacità di traduzione.
D’altra parte, OpenAI ha addestrato GPT-4 utilizzando dati disponibili pubblicamente e dati concessi in licenza. GPT-4 mira a generare una vasta gamma di risposte ed è stato affinato utilizzando l’apprendimento per rinforzo con feedback umano, allineando il suo comportamento con l’intento dell’utente.
È possibile accedere sia a PaLM 2 che a GPT-4 tramite i rispettivi chatbot, Bard e ChatGPT. Bard è disponibile gratuitamente in tutto il mondo, mentre ChatGPT Plus, con GPT-4, richiede un pagamento. Tuttavia, è possibile accedere gratuitamente a GPT-4 anche tramite Bing AI Chat di Microsoft, che utilizza questo modello. Questa accessibilità svolge un ruolo importante nella potenziale adozione di PaLM 2, essendo un modello open source.
Google ha integrato PaLM 2 in oltre 25 dei suoi prodotti, tra cui Android e YouTube, mentre Microsoft ha incluso funzionalità di intelligenza artificiale nella suite Office e in vari servizi. Sebbene GPT-4 abbia guadagnato popolarità tra sviluppatori e startup grazie al suo rilascio anticipato e al perfezionamento, la natura open source di PaLM 2 potrebbe attirare un pubblico più ampio.
Poiché PaLM 2 è un modello relativamente nuovo, la sua capacità di competere con GPT-4 è ancora in fase di valutazione. I piani ambiziosi di Google e le capacità uniche di PaLM 2 suggeriscono che potrebbe rappresentare una formidabile sfida per GPT-4. Tuttavia, GPT-4 rimane un modello potente, superando PaLM 2 in diversi aspetti. Tuttavia, i modelli più compatti di PaLM 2, in particolare le opzioni leggere come Gecko, offrono un vantaggio, soprattutto per i dispositivi mobili.
Con l’introduzione di PaLM 2 e il continuo sviluppo da parte di Google del modello di intelligenza artificiale multimodale Gemini, la competizione per il dominio dell’IA si è intensificata. L’impegno di Google nel progresso delle tecnologie AI indica una costante volontà di innovare e sfidare attori consolidati come GPT-4. Il futuro ci dirà come si evolveranno questi modelli linguistici e come influenzeranno il panorama dell’elaborazione del linguaggio naturale e dell’intelligenza artificiale nel suo complesso.