Andrej Karpathy, co-fondatore di OpenAI e inventore del termine “vibe coding”, ha recentemente offerto una visione chiara e realistica sullo stato attuale dei Large Language Model (LLM), sottolineando come questi sistemi, pur estremamente potenti, restino ancora incompleti e imperfetti. Nel corso del suo intervento all’evento “AI Startup School” organizzato da Y Combinator a San Francisco, Karpathy ha spiegato che, anziché immaginare i LLM come robot completamente autonomi alla Iron Man, è più corretto considerarli come una sorta di “tuta” che potenzia l’uomo, mantenendo sempre indispensabile il controllo umano.
Karpathy, che ha contribuito a portare Tesla all’avanguardia nell’intelligenza artificiale per la guida autonoma e che ha fondato Eureka Labs, una società dedicata alla formazione in AI, ha dedicato il suo discorso all’autonomia dell’intelligenza artificiale e al concetto di “vibe coding”, una modalità di sviluppo basata sull’interazione con i modelli di linguaggio.
Nel descrivere i Large Language Model, Karpathy li ha paragonati agli esseri umani: dotati di superpoteri in alcuni ambiti, ma allo stesso tempo affetti da numerose debolezze cognitive. Ha evidenziato che questi modelli tendono a generare “allucinazioni”, ovvero risposte errate o inventate, soffrono di scarsa consapevolezza di sé e di una sorta di smemoratezza che li rende vulnerabili a manipolazioni esterne. Inoltre, mostrano un’intelligenza disomogenea: riescono a risolvere problemi complessi con capacità sovrumane, ma contemporaneamente commettono errori banali che un essere umano non farebbe mai.
Questa combinazione di potenza e fragilità rende imprescindibile il ruolo del controllo umano nell’uso degli LLM. Karpathy invita a considerare questi modelli come “esseri sovrumani con molti difetti cognitivi” che necessitano di supervisione e collaborazione costante.
Un altro punto toccato riguarda l’entusiasmo diffuso verso gli agenti di intelligenza artificiale, programmi autonomi pensati per svolgere compiti complessi. Karpathy è scettico sul fatto che, almeno nel breve termine, questi agenti possano essere di grande aiuto pratico. Ad esempio, se un’AI genera diecimila righe di codice, il tempo necessario per rivederle può superare quello risparmiato. Per questo motivo, un agente completamente autonomo che gestisca tutte le attività è ancora lontano dall’essere utile.
Piuttosto, Karpathy preferisce immaginare l’AI come un’“armatura di Iron Man”, che amplifica e potenzia le capacità umane, anziché un robot indipendente che opera da solo. La priorità attuale, secondo lui, è creare prodotti parzialmente autonomi in grado di collaborare con le persone, piuttosto che puntare a dimostrazioni spettacolari ma poco pratiche di autonomia completa.
Sul tema della codifica, Karpathy suggerisce agli sviluppatori di non affrettarsi nel produrre grandi quantità di codice, ma di concentrarsi invece su prompt precisi e specifici che migliorino la qualità del codice generato. Questo approccio, definito “vibe coding”, permette di procedere in modo più efficiente e con risultati migliori.
Durante il suo intervento, Karpathy ha anche descritto l’attuale epoca come quella del “Software 3.0”. Se la prima generazione di software è rappresentata dal codice tradizionale scritto per i computer, e la seconda dalla creazione di reti neurali basate su pesi e parametri, la terza generazione è costituita dal linguaggio naturale – cioè i prompt – che comandano e programmano gli LLM. Questo cambio rappresenta un salto fondamentale, perché ora le reti neurali sono programmabili attraverso il linguaggio umano, dando origine a un nuovo tipo di computer unico nel suo genere.
Conclude così Karpathy: “Questo è un cambiamento radicale, e credo che potremmo chiamarlo software 3.0”, un’era che ridefinirà il modo in cui interagiamo con la tecnologia e che richiederà ancora una stretta collaborazione tra intelligenza artificiale e controllo umano.