Il fornitore di database a grafo Neo4j ha annunciato oggi nuove funzionalità per la ricerca vettoriale all’interno del proprio database. La tecnologia di database, nota come Neo4j, permette alle organizzazioni di creare una rappresentazione a grafo delle informazioni per comprendere in modo più approfondito le relazioni tra dati e contenuti.
A differenza dei tradizionali database relazionali, un database a grafo è strutturato in modo diverso. Invece di utilizzare righe e tabelle per organizzare i dati, un database a grafo utilizza nodi e relazioni per costruire una rappresentazione a grafo delle informazioni. L’integrazione dei vettori in Neo4j introduce un nuovo modo di contestualizzare ulteriormente il database a grafo, permettendo una ricerca avanzata e contribuendo all’attivazione di intelligenza artificiale generativa e modelli linguistici di grandi dimensioni (LLM).
Emil Eifrem, cofondatore e CEO di Neo4j, ha sottolineato l’importanza del supporto vettoriale nella cornice più ampia dell’intelligenza artificiale, affermando che questa caratteristica rappresenta un elemento chiave in questa prospettiva.
Con l’avvento della generazione di intelligenza artificiale, c’è stata una crescente richiesta di database con funzionalità vettoriali. Questa tecnologia trasforma il contenuto in valori numerici mediante l’uso di tecniche come il vicino più vicino approssimato (ANN), consentendo la ricerca di somiglianze. Oltre a piattaforme di database specificamente progettate per l’utilizzo di vettori, come Pinecone e Milvus, anche piattaforme di database esistenti come PostgreSQL, MongoDB e Redis si stanno estendendo per supportare i vettori.
L’innovazione chiave di Neo4j è l’integrazione dei vettori come nuovi tipi di proprietà all’interno dei nodi del grafico. Questi vettori costituiranno proprietà aggiuntive dei nodi, che potrebbero già contenere altre informazioni, come nomi di clienti o prodotti. Oltre a questa nuova proprietà vettoriale, Neo4j introduce anche un nuovo tipo di indice che consente la ricerca basata sulla similarità vettoriale.
Attualmente, Neo4j cattura relazioni esplicite tra concetti grazie alle sue funzionalità di database a grafo. L’aggiunta dei vettori, invece, consente di individuare relazioni implicite nei dati.
Emil Eifrem ha chiarito che mentre i database a grafo sono eccellenti nel rappresentare relazioni esplicite, i vettori sono straordinari nel dedurre relazioni implicite. La sinergia tra queste due capacità ha guidato la decisione di incorporare il supporto per dati vettoriali in Neo4j, con l’obiettivo di aiutare le persone a trarre significato dai dati attraverso la comprensione delle relazioni.
Eifrem ha spiegato che, a differenza dei tradizionali database relazionali, che organizzano i dati in righe e tabelle, un grafo della conoscenza esprime i dati come relazioni in forma di grafico. Questo approccio consente di visualizzare in modo più intuitivo le connessioni tra clienti specifici e i prodotti associati, nonché le gerarchie di prodotti. Inoltre, il grafico può illustrare le catene di fornitura, mostrando come i fornitori consegnano prodotti specifici attraverso una rete di collegamenti. In definitiva, questa metodologia mira a consentire alle aziende di rappresentare e identificare la propria conoscenza in un formato basato sui grafici.
Emil Eifrem ha sottolineato che combinare le relazioni intrinseche a un database a grafo con le capacità di un LLM può essere molto vantaggioso. Mentre i modelli linguistici di grandi dimensioni sono potenti, si basano su ipotesi probabilistiche per generare risposte. L’integrazione di un LLM con un database a grafo offre un’opportunità di maggiore precisione e può contribuire a ridurre le possibili incongruenze.
In sintesi, l’aggiunta delle funzionalità vettoriali a Neo4j rappresenta un passo significativo verso l’ottimizzazione delle capacità di ricerca e analisi all’interno di un database a grafo, aprendo nuove opportunità per comprendere e sfruttare le relazioni nei dati.