Non molto tempo fa, la startup Cognition ha stupito il mondo con Devin, un software engineer basato su AI che utilizza GPT-4 di OpenAI per scrivere e modificare codice in modo autonomo. Ma nel mondo veloce dell’AI, cinque mesi sono un’eternità.
Ora, un’altra startup chiamata Cosine, nata dall’acceleratore di startup Y Combinator, ha lanciato Genie, un nuovo ingegnere AI che promette di superare Devin. Genie ha ottenuto un punteggio del 30% nel test di benchmark SWE-Bench, rispetto al 13,8% di Devin e al 19% di Q di Amazon e Code Droid di Factory.
Genie è un modello avanzato di ingegneria del software che può gestire autonomamente una vasta gamma di attività di coding, come la correzione di bug, la creazione di nuove funzionalità, il refactoring del codice e la validazione tramite test. Può lavorare sia in modo indipendente che in collaborazione con gli utenti, cercando di offrire l’esperienza di avere un collega esperto.
Genie supporta 15 linguaggi di programmazione, tra cui JavaScript, Python, Java, C++, e molti altri. È progettato per imitare i processi cognitivi degli ingegneri umani, emulando il loro modo di pensare e risolvere i problemi.
Genie utilizza un modello GPT-4o a lungo contesto sviluppato tramite un programma sperimentale di OpenAI. Questo modello può generare fino a 64.000 token di output, un grande miglioramento rispetto ai 4.000 token iniziali di GPT-4o.
Il modello è stato addestrato su miliardi di token di dati, scelti per rendere Genie il più competente possibile nei linguaggi di programmazione più utilizzati. Cosine ha impiegato quasi un anno per raccogliere e utilizzare questi dati, ottenendo informazioni dettagliate su come gli ingegneri risolvono i problemi.
Genie sarà disponibile in due versioni:
- Versione Base: Prezzo competitivo intorno ai 20 dollari, con funzionalità limitate ma sufficienti per singoli e piccoli team.
- Versione Aziendale: Prezzo più elevato per funzionalità estese e uso illimitato, progettata per grandi team e aziende.
Genie potrebbe rivoluzionare lo sviluppo software, migliorando la produttività e riducendo il tempo dedicato alle attività di routine. Cosine prevede di ampliare la sua offerta con modelli per compiti più semplici e più complessi e di estendere il suo lavoro alla comunità open source.
Genie è già in fase di distribuzione per utenti selezionati, ma l’accesso più ampio è in fase di definizione. Gli interessati possono richiedere l’accesso anticipato compilando un modulo sul sito di Cosine.
Fondata nel 2022, Cosine è un laboratorio che mira a superare i confini dell’AI applicando il ragionamento umano alla risoluzione di problemi complessi. Finora, ha raccolto 2,5 milioni di dollari in finanziamenti e ha già fatto notevoli progressi nel campo dell’intelligenza artificiale.