Il post discute le sfide e le implicazioni dell’integrazione dei modelli di linguaggio a larga scala (LLM) con la ricerca su Internet. Di recente, Bard di Google, basato su Gemini Pro, ha superato OpenAI’s GPT-4 nella classifica Hugging Face Chat Bot Arena. Questo solleva aspettative per il prossimo modello di Google, Gemini Ultra. Tuttavia, ci sono dubbi sulla correttezza del confronto tra LLM e motori di ricerca.
I problemi legati alle “allucinazioni” dei LLM, ovvero risposte errate o fuorvianti, sono ben noti. L’integrazione degli LLM con Internet può fornire informazioni aggiornate e attribuire correttamente le fonti, ma ciò può distorcere lo scopo originale degli LLM. Secondo Subbarao Khambhampathi, professore di intelligenza artificiale, gli LLM non dovrebbero essere usati come motori di ricerca, poiché tendono a riassumere pochi link anziché fornire una comprensione autonoma.
Khambhampati sostiene che i motori di ricerca basati su IA possono indurre gli LLM ad allucinare fino a trovare la risposta “corretta”, il che potrebbe essere fuorviante. Afferma anche che modelli come GPT-4 contengono molte informazioni, tranne le notizie più recenti, ma critica il fatto che la provenienza dei dati non sia sempre chiara.
C’è anche il problema legale, come evidenziato dalla causa tra il New York Times e OpenAI, riguardante il recupero di informazioni dal web. Yangqing Jia di Lepton.AI osserva che la ricerca LLM è essenzialmente conversazionale e non sostituisce i motori di ricerca tradizionali.
Infine, si discute del “dilemma dell’innovatore” di Google. Nonostante le nuove alternative alla ricerca Google, l’azienda potrebbe non riuscire a mantenere la sua offerta principale di risposte precise alle domande. Dare Obasanjo sottolinea che mentre la ricerca sul web è utile per trovare link, i LLM sono migliori per ottenere risposte dirette. Tuttavia, Google sta ancora sperimentando l’uso dell’intelligenza artificiale nella ricerca e potrebbe potenzialmente superare le startup come Perplexity, integrando la ricerca LLM nel proprio browser.