Google DeepMind ha recentemente introdotto AlphaCode 2, un aggiornamento del precedente AlphaCode, in collaborazione con Gemini. Questa versione avanzata è progettata per affrontare problemi di programmazione competitiva in modo più efficiente rispetto al suo predecessore e agli altri concorrenti sul mercato.
AlphaCode 2 si basa su una serie di “modelli politici” che generano esempi di codice per ciascun problema. Successivamente, elimina gli esempi che non soddisfano le descrizioni dei problemi, producendo soluzioni più precise ed efficienti. L’approccio multimodale di AlphaCode 2 integra dati provenienti da varie fonti, tra cui documenti web, libri, risorse di codifica e contenuti multimediali.
Questo approccio è stato paragonato a Q* di OpenAI, un’entità che, a differenza di AlphaCode 2, sembra essere in grado di risolvere problemi matematici inediti. Tuttavia, AlphaCode 2 ha dimostrato prestazioni notevoli, risolvendo con successo il 43% dei problemi in 10 tentativi in 12 competizioni di codifica con oltre 8.000 partecipanti. Questo segna un notevole miglioramento rispetto alla versione precedente, che aveva una percentuale di successo del 25%.
Tuttavia, è importante notare che AlphaCode 2 ha alcune limitazioni. Richiede numerosi tentativi ed errori, comporta costi elevati su larga scala e dipende dalla sua capacità di eliminare esempi di codice inappropriati. L’aggiornamento a una versione più avanzata di Gemini, come Gemini Ultra, potrebbe risolvere alcune di queste sfide.
Il processo di perfezionamento di AlphaCode 2 coinvolge l’obiettivo formativo GOLD e include il clustering di campioni di codice semanticamente simili. Un modello di punteggio seleziona le soluzioni ottimali tra i 10 cluster più grandi di esempi di codice, fornendo una risposta accurata al problema.
Mentre AlphaCode 2 si distingue nella programmazione competitiva, altri strumenti come GitHub Copilot, basato su OpenAI Codex, si concentrano su assistenti di codifica più ampi. AlphaCode 2 offre un approccio unico per affrontare problemi complessi di programmazione, mentre altri strumenti come Llemma di EleutherAI e Code Llama di Meta hanno le proprie caratteristiche specializzate.
Inoltre, il presunto Q* di OpenAI rappresenta un significativo progresso nell’intelligenza artificiale in grado di risolvere problemi matematici senza precedenti. Tuttavia, la rapida evoluzione di questa tecnologia solleva preoccupazioni riguardo alla necessità di garanzie adeguate per modelli di intelligenza artificiale così potenti.
È importante notare che AlphaCode 2 e il presunto Q* di OpenAI non sono ancora ampiamente disponibili al pubblico, ma rappresentano promettenti sviluppi nell’intelligenza artificiale dedicata alla risoluzione di problemi complessi.