Nel competitivo mondo dell’intelligenza artificiale, due giganti si sfidano: ChatGPT e Claude AI. L’azienda LMSO, famosa per la creazione di Chatbot Arena e il modello Vicuna, ha recentemente aggiornato la sua classifica Chatbot Arena per mettere a confronto i chatbot AI con i loro rivali. Mentre i modelli offerti da Anthropic sono gratuiti, stanno riuscendo a mettere in discussione l’egemonia di OpenAI.
In cima alla classifica, dominano i modelli linguistici di grandi dimensioni alimentati da GPT-4, che sono al cuore di ChatGPT Plus e Bing AI. Tuttavia, man mano che scendiamo nella lista, emergono alcune sorprese inaspettate. I modelli Claude di Anthropic, tra cui Claude 1, Claude 2 e Claude Instant, superano il motore gratuito di ChatGPT, ovvero GPT-3.5. Questo suggerisce che ogni modello linguistico di grandi dimensioni sviluppato da Anthropic supera il suo equivalente gratuito di ChatGPT.
L’MLSO valuta questi modelli facendoli “combattere” in partite con segnali di input comparabili. Il modello che fornisce la risposta migliore vince, mentre gli altri perdono. Gli utenti possono scegliere il vincitore in base alle loro preferenze, senza sapere quali modelli stanno effettivamente competendo.
Una differenza notevole nelle capacità di elaborazione dei token tra ChatGPT Plus e Claude Pro, sebbene non influenzi la classifica LMSO, rappresenta comunque un vantaggio significativo per i modelli Claude rispetto a GPT, come già evidenziato da Decrypt.
Questo vantaggio nell’elaborazione dei token dimostra quanto i modelli Claude siano in grado di gestire input di grandi dimensioni in contesti complessi, elemento fondamentale per una user experience di alta qualità.
Claude 2, ad esempio, eccelle nella gestione di prompt lunghi, mentre Claude 1 e Claude Instant si comportano in modo simile o persino migliore di GPT-3.5 con istruzioni simili, dimostrando la loro competitività. La conoscenza pregressa di Claude può trasformare un suggerimento iniziale modesto in una risposta notevole.
Nella categoria dei modelli linguistici open source, il leader indiscusso è WizardLM, addestrato su LlaMA-2 di Meta con ben 70 miliardi di parametri. Vicuna 33B e l’originale LlaMA-2 di Meta seguono da vicino.
I modelli open source rivestono un ruolo cruciale nello sviluppo dell’intelligenza artificiale per diverse ragioni. Possono essere personalizzati localmente dagli utenti, coinvolgendo la comunità nel perfezionamento del modello. Grazie alla loro licenza aperta, i modelli linguistici open source sono anche più economici da gestire, il che spiega perché ne esistono numerosi rispetto ai modelli proprietari.
I chatbot devono essere altamente efficaci, adattabili e precisi, soprattutto quando si tratta di fornire assistenza al cliente e agire come assistenti personali. Con i modelli Claude che superano GPT-3.5, sia le aziende che gli utenti si trovano ora a dover prendere decisioni importanti sulla scelta del modello migliore per le proprie esigenze. Decrypt offre due guide utili per assistere nella selezione del modello ottimale.
Da notare che Claude Pro, il chatbot “premium” di Anthropic dedicato agli utenti più esigenti, è stato lanciato di recente. Questo modello entra in competizione diretta con ChatGPT Plus di OpenAI, offrendo un servizio di abbonamento a $20 al mese. ChatGPT, il chatbot AI più noto al mondo, ha conquistato oltre un milione di utenti in una sola settimana, ma la situazione potrebbe evolversi man mano che gli utenti valutano le alternative disponibili e ne considerano il valore a lungo termine.