Routin Model: L’Emergente Tattica di Selezione dei Grandi Modelli Linguistici
Negli Stati Uniti, un’onda di startup specializzate nel “routin model” sta emergendo, orientate a scegliere e collegare in tempo reale uno tra i tanti Large Language Models (LLM) basandosi sulle specifiche esigenze di un’azienda. Questo trend nasce dalla crescente richiesta delle imprese di trovare soluzioni che combinino bassi costi con elevata efficienza, soprattutto alla luce dell’aumento esponenziale dei LLM disponibili.
L’Information evidenzia come il panorama delle startup legate al routin model si stia espandendo rapidamente. Questo mette in evidenza come le aziende stiano rispondendo prontamente all’esplosiva domanda di soluzioni basate sull’intelligenza artificiale.
Mentre molte aziende optano per modelli all’avanguardia come il “GPT-4”, i costi associati possono essere proibitivi. Così, a seconda della specificità del lavoro, alcune imprese tendono ad inclinarsi verso modelli open source. È qui che entra in gioco il routin model: una strategia che differisce dalle “MLOps”, perché non si limita all’ottimizzazione dei modelli, ma li sceglie basandosi sulla query dell’azienda.
Un esempio pratico: GPT-4 potrebbe essere impiegato per compiti analitici complessi, mentre la sintesi di documenti potrebbe essere affidata a un modello open source. Questa distribuzione avviene attraverso un’API, da cui il termine “routing”.
Con oltre 300.000 modelli open source su piattaforme come Hugging Face, è cruciale identificare le caratteristiche e le prestazioni di ciascun modello. Startup come Martian, con sede a San Francisco, stanno già sfruttando questa opportunità. Il CEO di Martian, Yash Upadhyay, ha delineato come la loro piattaforma “traduca” vari LLM in architetture semplificate, facilitando così la valutazione.
Mentre alcune startup come Autumn8 stanno attirando investimenti per la loro focalizzazione sull’analisi e valutazione dei LLM, c’è un dibattito in corso sulla reale necessità e l’efficacia del routin model. Nonostante ciò, CEO come Upadhyay sottolineano la necessità di migliorare la comprensione dei LLM per garantirne un uso sicuro e affidabile.
Infine, con la crescente importanza della selezione e del routing per le startup IA, è plausibile che giganti del cloud come Amazon o piattaforme come Hugging Face inizino a offrire tali servizi. Tuttavia, c’è un potenziale conflitto di interessi, poiché queste stesse aziende offrono anche i loro servizi LLM.
In sintesi, mentre il valore a lungo termine delle startup focalizzate sul routin model rimane incerto, il loro emerger evidenzia l’incessante ricerca delle aziende di ottimizzare i costi associati all’impiego dell’intelligenza artificiale.