I chatbot basati su modelli linguistici di grandi dimensioni (LLM) hanno sicuramente bisogno di miglioramenti. Gli esperti del settore hanno dedicato molto tempo alla ricerca di soluzioni per affrontare questa sfida. Mark Cuban, il miliardario americano appassionato di intelligenza artificiale, sembra aver trovato una soluzione interessante. La sua idea consiste nell’addestrare i modelli con accesso a proprietà intellettuale e dati significativi, al fine di sviluppare grandi modelli di conoscenza.
Tuttavia, c’è un unico problema, come Cuban ha spiegato: ottenere questi dati non sarebbe gratuito. Ciò aprirebbe una nuova competizione nel campo dell’IA: quali grandi aziende tecnologiche, come Google, Microsoft o Meta, sarebbero le prime a pagare per i dati e a quale costo?
Questa questione è di importanza cruciale perché molte aziende utilizzano modelli e API basati su GPT per generare contenuti, ma i dati su cui vengono addestrati questi chatbot, come ChatGPT, spesso non sono rilevanti per molte di esse. Ecco perché OpenAI ha introdotto i plug-in per ChatGPT, in modo che le aziende possano consentire al chatbot di accedere ai propri dati proprietari e rispondere alle domande basandosi su tali informazioni.
Ciò solleva anche diverse preoccupazioni legate alla privacy. Molte aziende sono riluttanti ad utilizzare GPT o Bard e caricare le proprie informazioni private, che diventerebbero quindi accessibili a esperti di grandi aziende tecnologiche.
Steve Jarret, responsabile dell’intelligenza artificiale e dei dati presso Orange, ha paragonato gli LLM a una piattaforma di sistema operativo. Ciò significa che questi chatbot sono fondamentalmente progettati per fornire solo funzionalità di base, come Android o iOS consentono di utilizzare il proprio telefono. Tuttavia, i plug-in introdotti da OpenAI sono simili alle app che installiamo, progettate per casi d’uso specifici e in grado di migliorare le capacità del chatbot.
Questo significa che le grandi aziende tecnologiche che stanno costruendo LLM e li stanno fornendo a quante più organizzazioni possibile devono integrare e incorporare ulteriori funzionalità nelle loro offerte principali come ChatGPT o Bard. Queste funzionalità dovrebbero includere informazioni che consentano agli LLM di collegarsi ai dati proprietari dell’azienda. Ciò aiuterebbe i modelli a fornire informazioni guidate dalla conoscenza, che è ciò che le aziende desiderano alla fine.
Se OpenAI o Google non integrassero funzionalità come l’inserimento di dati proprietari, anche senza plug-in, le persone che creano tali plug-in inizierebbero a venderli direttamente alle aziende. Ciò renderebbe gli LLM inutili in modo indipendente.
Per esempio, un’azienda che crea un plug-in per accedere ai dati finanziari da un sito web potrebbe iniziare a venderlo per essere collegato a qualsiasi LLM. Ecco perché le aziende dovrebbero acquistare l’accesso esclusivo ai dati di proprietà intellettuale, grazie ai quali sarebbero in grado di addestrare chatbot esperti che le aziende potrebbero utilizzare così com’è.
Inoltre, ciò consentirebbe alle aziende di utilizzare modelli generativi specifici per casi d’uso, combinati con LLM, al fine di generare risposte più mirate. Se vengono creati chatbot basati su casi d’uso specifici, sarebbero ideali per le singole aziende. Questi modelli, se alimentati con dati proprietari, sarebbero in grado di generare risposte coerenti con le aspettative degli utenti, proprio come fanno i modelli LLM attuali.
Elon Musk sta cercando di costruire il suo concorrente di ChatGPT. Sebbene ultimamente non siano emerse molte informazioni sulle intenzioni di Musk riguardo all’IA generativa, sembra coinvolgere molti ricercatori per sviluppare qualcosa correlato a questa tecnologia di tendenza. È interessante notare che Musk possiede qualcosa che nessun’altra azienda ha: i dati di Twitter, che possono essere considerati una miniera d’oro.
In passato, OpenAI aveva accesso a questi dati, ma Musk li ha ritirati quando è diventato CEO dell’azienda. Ora prevede di intentare una causa contro OpenAI, accusandola di aver utilizzato i dati per creare ChatGPT. Al momento, sta creando una società ombrello chiamata X Corp.
C’è una forte possibilità che il chatbot di Musk, basato su tali dati, sia effettivamente “ben informato”. Secondo Cuban, il TruthGPT di Musk sarebbe in anticipo rispetto alle offerte di Google, Meta e Microsoft e dovrebbe anche essere open source. “Può considerare i suoi tweet e quelli delle fonti che gli piacciono e finire con un consumatore che interagisce con un’intelligenza artificiale che può essere un Elon virtuale. Interessante e al tempo stesso spaventoso”, ha affermato Cuban.
La parte spaventosa di costruire un modello di intelligenza artificiale basato su Twitter è la quantità di sforzo necessario per filtrare le opinioni irrilevanti e, in alcuni casi, pericolose delle persone.
D’altro canto, se Musk non dovesse costruire un chatbot basato sui suoi “dati di proprietà intellettuale”, qualcun altro lo farebbe. Quando Bard è stato rilasciato, molte persone hanno chiesto informazioni sul suo set di dati, e la risposta è stata che è stato addestrato con dati da Gmail. Google ha prontamente smentito questa affermazione, ma ciò solleva comunque dubbi sulla privacy riguardo a questo chatbot. Inoltre, i dati di Gmail sono effettivamente una proprietà intellettuale di Google.
La stessa situazione si applica a ChatGPT di Microsoft e OpenAI. Musk potrebbe evitare qualsiasi conseguenza legale se utilizzasse i dati di Twitter per addestrare il suo modello di intelligenza artificiale, a differenza di OpenAI, che è stata citata in giudizio e accusata di utilizzare dati privati per l’addestramento dei modelli.
Le politiche sulla privacy di Twitter affermano chiaramente che, pubblicando contenuti pubblicamente, gli utenti acconsentono a divulgarli nel modo più ampio possibile, incluso tramite le API di Twitter, e invitano chiunque acceda a tali informazioni tramite le API a fare lo stesso.
Ciò potrebbe preoccupare le persone che non desiderano che un’intelligenza artificiale venga addestrata sui loro dati, ma la verità è che, pubblicando su Twitter, gli utenti hanno accettato l’informativa sulla privacy. Sembra che Musk abbia acquisito Twitter per 44 miliardi di dollari solo per accedere ai dati. Ora ha il diritto esclusivo di creare un chatbot utilizzando i dati dei social media.
Questo potrebbe essere anche l’occasione per Google o OpenAI di costruire il proprio fossato con dati di proprietà intellettuale, anziché con dati pubblicamente disponibili.