Utilizzare API esterne o costruire da zero? La scelta delle aziende per l’implementazione dell’IA generativa

Nel corso del mese scorso, JPMorgan Chase ha dato il via libera allo sviluppo di un modello simile a ChatGPT chiamato IndexGPT. Questo modello offre consulenza sugli investimenti basata sull’intelligenza artificiale ed è destinato a clienti selezionati. Allo stesso modo, alcuni mesi fa Goldman Sachs ha annunciato di lavorare a un chatbot basato sull’intelligenza artificiale per assistere gli sviluppatori nella scrittura di codice. Anche Amazon e Apple stanno sviluppando i propri modelli linguistici, con l’obiettivo di superare i modelli GPT di OpenAI.

È interessante notare che molte di queste aziende avevano precedentemente vietato l’uso di ChatGPT per scopi interni. Inoltre, anche società come Samsung, Bank of America e Wells Fargo hanno impedito ai propri dipendenti di utilizzare il chatbot addestrato pubblicamente per paura di divulgare informazioni sensibili o confidenziali.

Uno dei motivi principali per cui le aziende sviluppano i propri modelli linguistici è la questione della sicurezza. Esistono preoccupazioni riguardo all’accesso ai dati aziendali tramite modelli LLM (Large Language Model) proprietari come GPT. Di conseguenza, molte aziende preferiscono prendere un modello open source e perfezionarlo per le proprie esigenze.

Costruire il proprio LLM è simile a costruire i propri chip. Anche se la maggior parte delle aziende può utilizzare modelli esistenti e personalizzarli leggermente, solo poche sono interessate a costruire qualcosa di molto specifico. La maggior parte delle aziende preferisce utilizzare gli stessi LLM già disponibili, poiché risulta più pratico.

Per esempio, un’azienda potrebbe decidere di integrare i modelli di linguaggio di OpenAI nel proprio chatbot automatizzato per il servizio clienti, al fine di renderlo più umano. Spesso questo approccio risulta superiore allo sviluppo di modelli linguistici personalizzati, che può essere costoso, richiedere tempo e non garantire risultati comparabili.

Tuttavia, l’utilizzo delle API di OpenAI presenta anche dei drawback significativi. I costi possono aumentare rapidamente per le applicazioni ad alto traffico, a causa delle tariffe d’uso. Inoltre, le funzionalità dell’applicazione sono limitate dai termini di utilizzo di OpenAI, che possono limitare la flessibilità e l’adattabilità di una startup.

Inoltre, a causa del GDPR in Europa, le aziende non possono utilizzare le API di OpenAI o Google. I modelli LLM offerti da queste aziende non sono compatibili con la politica GDPR, in quanto il regolamento li considera una violazione della privacy. Questo rappresenta un altro motivo per preferire l’utilizzo di modelli anziché richiedere un’API esterna.

In passato, si credeva che solo poche aziende di ricerca con risorse sostanziali, come OpenAI, Google DeepMind, Anthropic e Cohere, avessero il capitale, l’esperienza di ricerca e la potenza di calcolo necessari per creare, addestrare e proteggere modelli di intelligenza artificiale grandi e sofisticati. Tuttavia, oggi ci sono diverse piattaforme, come LLaMA, Vicuna e Falcon, che stanno aiutando piccole e medie imprese a sviluppare i propri modelli LLM per casi d’uso specializzati o di ricerca. La scelta di utilizzare un modello LLM o costruirne uno proprio dipende da vari fattori, come la maturità aziendale, la forza lavoro e le risorse finanziarie disponibili.

I ricercatori sottolineano il rapido sviluppo e la condivisione di nuovi modelli su piattaforme open source come Hugging Face e GitHub. Questi modelli spesso sono più compatti, veloci, personalizzabili e richiedono meno tempo di sviluppo, pur presentando capacità comparabili o superiori rispetto ai modelli creati da attori finanziariamente più forti, come Google e OpenAI.

Nonostante le aziende si affidino spesso alle API di OpenAI o Google per implementare l’IA generativa, recentemente è emerso un documento presumibilmente scritto da un ricercatore di Google che evidenzia come alcuni individui all’interno di queste importanti aziende di ricerca considerino l’open source una minaccia significativa.

La comunità dell’IA open source sta vivendo un aumento di attività notevole. Hugging Face, un importante repository di modelli, dataset e strumenti di machine learning open source, riporta che oltre 15.000 aziende utilizzano la loro piattaforma, condividendo più di mezzo milione di modelli, dataset e dimostrazioni.

Dall’introduzione di ChatGPT lo scorso novembre, gli sviluppatori hanno contribuito con oltre 100.000 modelli pubblici per diverse attività, come previsione della prossima parola, riempimento delle maschere, classificazione dei token e delle sequenze, e così via. Questa tendenza riflette l’interesse crescente delle grandi aziende in diversi settori nel sfruttare modelli di generazione di testo e immagini basati sull’IA per trasformare funzioni aziendali fondamentali, come creazione di contenuti, marketing e servizio clienti, come dimostrato dai casi di JPMorgan Chase e Goldman Sachs.

Quando si tratta di implementare l’IA generativa, molte aziende, come Salesforce e Snapchat, scelgono di accedere a modelli sviluppati e ospitati da Google o OpenAI tramite le loro API. Questo perché non devono preoccuparsi del GDPR e della possibile divulgazione di informazioni sensibili.

In definitiva, la scelta tra creare un modello linguistico proprietario o affidarsi a modelli preesistenti dipende dalle singole aziende. Alcune potrebbero preferire l’opzione di partenza da zero, ma molte si appoggiano alle API di OpenAI o Google come base per i loro futuri casi d’uso, mentre altre scelgono un compromesso tra le due opzioni.

Utilizzare API esterne o costruire da zero? La scelta delle aziende per l’implementazione dell’IA generativa

DiFantasy

Di Fantasy

Articoli correlati

Moonshot AI sospende i nuovi abbonamenti a Kimi K3 per carenza di capacità GPU

ComiXR porta fumetti e webtoon negli ambienti di realtà estesa

Frozen v2: il chip Google che integrerà parti di Gemini direttamente nell’hardware

Ultimi Post

Moonshot AI sospende i nuovi abbonamenti a Kimi K3 per carenza di capacità GPU

ComiXR porta fumetti e webtoon negli ambienti di realtà estesa

Frozen v2: il chip Google che integrerà parti di Gemini direttamente nell’hardware

Kimi K3 sposta il fabbisogno dell’infrastruttura AI dalla potenza di calcolo alla memoria HBM