Nel campo del Retrieval Augmented Generation (RAG) per l’intelligenza artificiale aziendale, i modelli di incorporamento sono fondamentali. Questi modelli trasformano vari tipi di contenuto in vettori, rendendoli comprensibili e utilizzabili nelle applicazioni AI e RAG. Sebbene OpenAI avesse un forte dominio con il suo modello di incorporamento “ada”, molte aziende hanno scoperto che non è sufficientemente specifico per i loro casi d’uso. È qui che entra in gioco Voyage AI.
Voyage AI ha annunciato di aver raccolto 20 milioni di dollari in finanziamenti di serie A per sviluppare modelli di incorporamento e recupero per l’AI RAG aziendale. Tra i sostenitori di Voyage AI c’è Snowflake, che sta per integrare i modelli di Voyage AI nel suo servizio Cortex AI, basato sulla tecnologia derivante dall’acquisizione di Neeva, un fornitore di ricerca AI.
La missione di Voyage AI è migliorare il RAG aziendale attraverso un modello di incorporamento multilingue che supporta 27 lingue con un alto grado di accuratezza. Tengyu Ma, fondatore e CEO di Voyage AI, ha spiegato: “Miglioriamo la qualità del recupero; quando si hanno più documenti pertinenti, la risposta è migliore. Se non ci sono documenti rilevanti, i modelli linguistici possono generare informazioni errate.”
I modelli di incorporamento non sono nuovi e sono essenziali per addestrare modelli linguistici di grandi dimensioni. Voyage AI si concentra sulla creazione di modelli di incorporamento e reranker per migliorare la qualità del recupero. Secondo Ma, gli approcci esistenti, in particolare il modello ada di OpenAI, non soddisfano i requisiti di accuratezza sempre più elevati: “Eseguiamo incorporamenti con una migliore precisione e una maggiore comprensione di concetti complessi.”
Voyage AI ottimizza ogni parte della pipeline di training, compresa la raccolta e il filtraggio dei dati, addestrando i suoi modelli su specifici domini, come codifica, finanza e diritto, per ottenere prestazioni migliori.
La formazione dei modelli può essere complessa, soprattutto a causa dei dati non etichettati. Voyage AI utilizza una tecnica chiamata apprendimento contrastivo, che si differenzia dal tipico approccio di “previsione della parola successiva”. Invece di prevedere quale parola dovrebbe seguire, l’apprendimento contrastivo crea coppie di dati contrastivi da utilizzare per l’addestramento.
Per Snowflake, supportare e integrare Voyage AI significa rendere l’intelligenza artificiale più utile per gli utenti aziendali. Vivek Raghunathan, SVP of Engineering presso Snowflake, ha spiegato che la loro strategia prevede di permettere agli utenti di interagire con i propri dati, siano essi strutturati o non strutturati.
Snowflake è entusiasta delle capacità avanzate che i modelli di Voyage AI offriranno, inclusa la supporto multilingue e finestre di contesto più lunghe, che miglioreranno ulteriormente i casi d’uso aziendali. Attualmente, Snowflake utilizza un modello di incorporamento chiamato Artico, ma i modelli di Voyage AI offriranno un’alternativa per gli utenti, specialmente per casi d’uso complessi.
“Pensiamo alla frontiera tra efficienza e qualità; i nostri modelli sono focalizzati su dimensioni specifiche, mentre quelli di Voyage AI offrono una qualità molto più alta per i casi d’uso realmente difficili”, ha concluso Raghunathan.