Qodo, piattaforma di qualità del codice alimentata dall’intelligenza artificiale e precedentemente nota come Codium, ha annunciato il lancio di Qodo-Embed-1-1.5B, un nuovo modello di embedding del codice open source che offre prestazioni all’avanguardia pur essendo significativamente più piccolo ed efficiente rispetto alle soluzioni concorrenti. Progettato per migliorare la ricerca, il recupero e la comprensione del codice, questo modello da 1,5 miliardi di parametri raggiunge risultati di primo livello nei benchmark di settore, superando modelli più grandi di OpenAI e Salesforce.​

Le soluzioni di codifica alimentate dall’IA si sono tradizionalmente concentrate sulla generazione di codice, con i grandi modelli linguistici (LLM) che hanno attirato l’attenzione per la loro capacità di scrivere nuovo codice. Tuttavia, come spiegato da Itamar Friedman, CEO e co-fondatore di Qodo, in un’intervista video: “Il software aziendale può avere decine di milioni, se non centinaia di milioni, di linee di codice. La sola generazione di codice non è sufficiente: è necessario garantire che il codice sia di alta qualità, funzioni correttamente e si integri con il resto del sistema”.​
Wikipedia

I modelli di embedding del codice svolgono un ruolo cruciale nello sviluppo assistito dall’IA, consentendo ai sistemi di cercare e recuperare in modo efficiente frammenti di codice rilevanti. Questo è particolarmente importante per le grandi organizzazioni in cui i progetti software si estendono su milioni di linee di codice attraverso più team, repository e linguaggi di programmazione. Friedman ha sottolineato: “Il contesto è fondamentale per qualsiasi cosa legata alla costruzione di software con modelli. In particolare, per ottenere il contesto giusto da una codebase davvero ampia, è necessario utilizzare un meccanismo di ricerca”.​

Qodo-Embed-1-1.5B si distingue per il suo equilibrio tra efficienza e accuratezza. Mentre molti modelli all’avanguardia si basano su miliardi di parametri—il text-embedding-3-large di OpenAI ne ha 7 miliardi, ad esempio—il modello di Qodo ottiene risultati superiori con soli 1,5 miliardi di parametri. Nei benchmark del Code Inferno, Qodo-Embed-1-1.5B ha superato modelli più grandi in termini di precisione e velocità, stabilendo un nuovo standard per l’embedding del codice nelle applicazioni aziendali.​

Questo risultato è particolarmente significativo per i team di sviluppo aziendale che gestiscono codebase vaste e complesse. Qodo-Embed-1-1.5B consente un recupero del codice più accurato ed efficiente, affrontando una sfida critica nello sviluppo assistito dall’IA: la consapevolezza del contesto nei sistemi software su larga scala. Integrando questo modello nei flussi di lavoro esistenti, le aziende possono migliorare la qualità del codice, ridurre i tempi di sviluppo e facilitare una migliore collaborazione tra i team.

Di Fantasy