All’anniversario esatto del lancio di GPT-4 da parte di Sam Altman, con la sua iconica foto e zaino blu, il mondo attende con impazienza l’arrivo di GPT-5. La risposta di Altman a una richiesta su X per il rilascio della nuova versione è stata: “Pazienza, Jimmy. Ne varrà la pena”. Da quel momento, le speculazioni su cosa potrà fare GPT-5 e quando verrà lanciato si sono intensificate.
L’evoluzione verso la Multimodalità
Una delle attese principali per GPT-5 è la sua capacità di essere un modello multimodale fin dall’inizio, elaborando non solo testo ma anche immagini, audio e video. Questa anticipazione si basa sull’annuncio di Sora, che Mira Murati, CTO di OpenAI, ha indicato sarà disponibile per il pubblico entro fine anno e che si prevede sarà integrato in GPT-5.
In una conversazione con Bill Gates nel podcast Unconfuse Me, Altman ha delineato il percorso di OpenAI verso lo sviluppo di modelli sempre più avanzati, enfatizzando la multimodalità di GPT-5 come capacità fondamentale. Questo modello sarà in grado di elaborare video e generare contenuti video nuovi, evidenziando che i lavori su questa nuova generazione sono già in corso.
Personalizzazione e Ragionamento Avanzato
Un altro aspetto su cui GPT-5 mirerà a migliorare significativamente è la personalizzazione. Altman ha discusso l’importanza di un sistema capace di apprendere dalle email dell’utente, dal suo calendario e dalle sue preferenze personali, connettendosi a fonti di dati esterne per offrire un servizio su misura.
La capacità di ragionamento di GPT-5 sarà molto più sofisticata rispetto ai suoi predecessori. Altman ha illustrato le limitazioni di GPT-4 nel ragionamento, sottolineando l’obiettivo di GPT-5 di fornire risposte altamente affidabili e precise, migliorate sostanzialmente anche nell’ambito della programmazione.
Un Modello Più Intelligente e Veloce
Durante il recente vertice del governo mondiale a Dubai, Altman ha enfatizzato come GPT-5 sarà progettato per essere più veloce e più efficiente in ogni compito, oltrepassando i limiti dei modelli focalizzati su singole abilità.
Si prevede inoltre che GPT-5 avrà funzioni di agente autonomo, migliorando le collaborazioni recenti, come quella con Figure, che ha dotato ChatGPT di voce e “corpo”, potenziando le sue applicazioni pratiche.
Ampliamento della Lunghezza del Contesto
Con il panorama competitivo che si evolve rapidamente, si attende che OpenAI aumenti significativamente la lunghezza del contesto gestibile dai suoi modelli AI. Attualmente, GPT-4 gestisce un massimo di 32k di lunghezza contestuale, con GPT-4 Turbo che estende questa capacità a 128k. Si prevede che GPT-5 supererà di gran lunga questi limiti, posizionandosi come leader nel settore.
Impostazione del Benchmark per l’AGI
Con la concorrenza che fa passi da gigante, si aspetta che GPT-5 eccella nei benchmark esistenti, affrontando in modo definitivo le sfide come le allucinazioni dei modelli e implementando tecniche avanzate per migliorare l’accuratezza e la pertinenza delle risposte.
La discussione sull’Automazione Generale dell’Intelligenza (AGI) e l’impatto sull’occupazione continua ad essere un tema caldo. Contrariamente alle preoccupazioni sulla sostituzione del lavoro umano, Altman vede GPT-5 come un amplificatore dell’intelligenza umana, con il potenziale di elevare le capacità di miliardi di utenti.
In questo scenario di attesa e anticipazione, la comunità globale rimane in trepidante attesa di vedere come GPT-5 trasformerà il panorama dell’intelligenza artificiale, promettendo avanzamenti nel ragionamento, nella personalizzazione e nella multimodalità che potrebbero ridefinire il modo in cui interagiamo con la tecnologia.