Il mercato dei database vettoriali è stato al centro dell’attenzione nel 2023, poiché questi strumenti hanno dimostrato di essere essenziali per fornire contesto e memoria a lungo termine ai modelli linguistici di grandi dimensioni. Ciò ha portato a un aumento dell’efficienza e dell’accuratezza delle tecniche RAG (Retrieve, Add, Generate), contribuendo così a ridurre le “allucinazioni” dell’intelligenza artificiale. In questo contesto, la startup con sede a New York, Pinecone, ha attirato particolare interesse.
Pinecone, che ha raccolto 100 milioni di dollari lo scorso aprile, sta ora lanciando ciò che definisce una “rivoluzionaria” architettura di database vettoriale serverless. Questa innovazione consentirà alle aziende di sviluppare applicazioni AI ancora più avanzate ed efficienti in termini di costi. Secondo un comunicato stampa, Pinecone serverless promette una riduzione dei costi fino a 50 volte e “risolve i problemi legati all’infrastruttura, consentendo alle aziende di lanciare applicazioni di intelligenza artificiale di altissima qualità in tempi molto più rapidi”.
Le innovazioni chiave di questa architettura includono la separazione di letture, scritture e archiviazione per ridurre i costi del carico di lavoro, un’architettura unica con clustering vettoriale sopra l’archiviazione blob per offrire ricerche vettoriali fresche, a bassa latenza e a basso costo su dimensioni di dati quasi illimitate, algoritmi di indicizzazione e recupero progettati da zero e un livello di elaborazione multi-tenant per il recupero su richiesta per migliaia di utenti.
Il CEO di Pinecone, Edo Liberty, sottolinea l’importanza di questa nuova architettura serverless per l’intero settore. “Non dico questo a cuor leggero”, ha dichiarato in un’intervista a VentureBeat. “Abbiamo lavorato duramente su questo progetto per un anno e mezzo: è stata la nostra sfida più ambiziosa finora”.
Liberty ha chiarito che l’obiettivo principale di Pinecone non è solo creare il miglior database vettoriale, ma abilitare una nuova generazione di applicazioni e funzionalità nell’ambito dell’intelligenza artificiale generativa, che fino ad ora non erano possibili. L’obiettivo è ridurre le “allucinazioni” che hanno impedito alle grandi aziende di offrire applicazioni di intelligenza artificiale all’avanguardia per i loro clienti.
Aziende come Notion, Blackstone, Canva, Domo e Gong hanno già sperimentato Pinecone serverless. Liberty ha evidenziato che il nuovo prodotto è ora accessibile anche a clienti che necessitano di indicizzare miliardi di vettori per decine o centinaia di migliaia di utenti, fornendo RAG e conoscenza su larga scala. La caratteristica più sorprendente è che tutto ciò può essere fatto in modo molto più semplice ed economico, con costi inferiori del 10% rispetto ad altri sistemi.
In definitiva, Pinecone serverless rappresenta un passo significativo nell’evoluzione dell’ecosistema dell’intelligenza artificiale generativa e delle tecnologie associate. Il lancio del prodotto include integrazioni con altre importanti aziende nel campo dell’IA, come Anthropic, Anyscale, Cohere, Confluent, Langchain, Pulumi e Vercel, indicando che il settore sta entrando in una nuova fase di sviluppo e collaborazione.