Vectara continua a crescere come piattaforma di ricerca conversazionale basata sull’intelligenza artificiale, introducendo oggi nuove funzionalità volte a migliorare l’intelligenza artificiale generativa per i dati aziendali.
La startup con sede a Santa Clara, in California, è emersa in modo sorprendente nell’ottobre 2022, guidata dall’ex CTO e fondatore del fornitore di big data Cloudera. Originariamente, Vectara ha presentato la sua piattaforma come una tecnologia di ricerca neurale come servizio. Questo approccio combina modelli di linguaggio di grandi dimensioni (LLM) basati sull’intelligenza artificiale, elaborazione del linguaggio naturale (NLP), pipeline di integrazione dei dati e tecniche vettoriali per creare una rete neurale ottimizzabile per la ricerca.
Attualmente, l’azienda sta ampliando le proprie capacità con l’IA generativa, che offre il riassunto dei risultati per un’esperienza di intelligenza artificiale più conversazionale. Inoltre, la società sta introducendo ciò che definisce “capacità di generazione basata sul terreno” per ridurre il rischio di allucinazioni dell’IA e migliorare l’accuratezza complessiva della ricerca.
“Stiamo passando dalla tradizionale esperienza di un motore di ricerca che fornisce un elenco di risultati, e ciò su cui ChatGPT ci ha fatto riflettere è che ciò che tutti i consumatori vogliono è la risposta”, ha dichiarato il CEO e cofondatore di Vectara, Amr Awadallah, a VentureBeat. “Vogliamo solo la risposta, non un elenco di risultati che dobbiamo leggere per comprendere cosa stiamo cercando: vogliamo solo la risposta stessa.”
Oltre alle nuove funzionalità, Vectara ha annunciato di aver concluso una fase seed round di finanziamento da 28,5 milioni di dollari. Il round seed include i 20 milioni di dollari già annunciati da Vectara nell’ottobre 2022. La Race Capital ha guidato l’investimento, e tra i nuovi membri del consiglio di consulenza strategica si annovera Matei Zaharia, CTO di Databricks.
Quando Vectara è emersa per la prima volta nel 2022, c’erano pochi concorrenti nello spazio della ricerca generativa di intelligenza artificiale, ma la situazione è cambiata rapidamente nel 2023.
Negli ultimi mesi, Google ha presentato un’anteprima della sua esperienza di ricerca generativa durante la conferenza I/O di Google il 15 maggio. Anche Bing di Microsoft si è integrato con OpenAI per fornire un’esperienza di intelligenza artificiale generativa. Inoltre, Elasticsearch ha esteso le sue funzionalità per integrare l’IA generativa con un aggiornamento annunciato il 23 maggio.
Awadallah è consapevole del panorama competitivo in continua evoluzione, ma si mostra fiducioso nella differenziazione della sua azienda. Un elemento fondamentale della piattaforma Vectara è ciò che viene definito “motore di recupero”, una tecnologia che combina i giusti concetti semantici con le voci di un database vettoriale.
La base originale per il motore di recupero di Vectara deriva dalla ricerca condotta nel 2019 dal cofondatore di Awadallah, Amin Ahmad, mentre lavorava per Google. Questa ricerca è stata descritta in un articolo del 2019, “Multilingual Universal Sentence Encoder for Semantic Retrieval”. Awadallah ha spiegato che Vectara ha migliorato il design originale, creando un sistema di recupero estremamente accurato.
Prima dell’ultimo aggiornamento, la piattaforma di ricerca forniva agli utenti un elenco di risultati che beneficiava delle parole chiave semantiche e delle capacità di intelligenza artificiale. Tuttavia, l’elenco dei risultati rimaneva solo un elenco che l’utente doveva esaminare per ottenere una risposta.
Con l’aggiornamento della piattaforma, gli utenti possono ora ottenere un risultato generativo di IA che riassumerà le fonti più rilevanti per fornire una risposta a una domanda.
I risultati generativi di IA, come quelli di ChatGPT, possono potenzialmente incorrere in rischi di allucinazione dell’IA, in cui potrebbe essere mostrato un risultato inaccurato. Awadallah ha spiegato che le allucinazioni si verificano nei modelli di linguaggio di grandi dimensioni perché il modello ha compresso una grande quantità di informazioni e potrebbe generare una risposta errata.
Per affrontare questo problema, Vectara ha adottato un approccio di generazione radicata, chiamato anche generazione arricchita di recupero, utilizzato da altri fornitori. L’idea di base è che i risultati generati siano associati a una citazione della fonte per migliorare l’accuratezza e guidare gli utenti verso ulteriori informazioni dalla fonte originale.
La piattaforma Vectara utilizza anche un approccio di machine learning (ML) chiamato “zero shot”, che consente al modello di apprendere continuamente dai nuovi dati senza richiedere ulteriori ottimizzazioni e riaffinamenti.
Nel complesso, la strategia dell’azienda consiste nell’aiutare le aziende non solo a trovare i risultati di ricerca corretti, ma anche a fornire azioni agli utenti finali.