GPT-4 : 10 modi per cui è impressionante ma ancora imperfetto

OpenAI ha aggiornato la tecnologia che alimenta il suo chatbot online in modi notevoli. È più preciso, ma inventa ancora le cose.

Una nuova versione della tecnologia che alimenta un A.I. il chatbot che ha affascinato l’industria tecnologica quattro mesi fa è migliorato rispetto al suo predecessore. È un esperto in una vasta gamma di argomenti, entusiasmando persino i medici con i suoi consigli medici. Può descrivere immagini ed è vicino a raccontare barzellette quasi divertenti.

Ma il nuovo sistema di intelligenza artificiale a lungo vociferato, GPT-4, ha ancora alcune delle stranezze e commette alcuni degli stessi errori abituali che hanno sconcertato i ricercatori quando è stato introdotto quel chatbot, ChatGPT. E sebbene sia un test terribilmente bravo, il sistema – dalla start-up OpenAI di San Francisco – non è sul punto di eguagliare l’intelligenza umana.

1) Ha imparato ad essere più preciso.
Quando un AI esperto ha utilizzato GPT-4 in un recente pomeriggio, ha detto al bot che parlava inglese senza alcuna conoscenza dello spagnolo. Ha chiesto un programma che potesse insegnargli le basi e il bot ne ha fornito uno dettagliato e ben organizzato. Ha anche fornito una vasta gamma di tecniche per imparare e ricordare le parole spagnole. Il signor Nicholson ha chiesto un aiuto simile dalla versione precedente di ChatGPT, che si basava su GPT-3.5. Anch’esso forniva un programma, ma i suoi suggerimenti erano più generali e meno utili.

2) Ha migliorato la sua precisione.
Quando un AI ricercatore e professore, per primo ha provato il nuovo bot, ha posto una semplice domanda, il bot ha risposto correttamente. La versione precedente della risposta di ChatGPT a questa domanda era sempre sbagliata. Farlo bene indica che il nuovo chatbot ha una gamma più ampia di conoscenze. Ma commette ancora errori.

3) Può descrivere immagini con dettagli impressionanti.
GPT-4 ha una nuova capacità di rispondere alle immagini e al testo. Greg Brockman, presidente e co-fondatore di OpenAI, ha dimostrato come il sistema potrebbe descrivere un’immagine dal telescopio spaziale Hubble nei minimi dettagli. La descrizione andava avanti per paragrafi. Può anche rispondere a domande su un’immagine. Se viene fornita una fotografia dell’interno di un frigorifero, può suggerire alcuni pasti da preparare con ciò che è a portata di mano. OpenAI non ha ancora rilasciato al pubblico questa parte della tecnologia, ma una società chiamata Be My Eyes sta già utilizzando GPT-4 per creare servizi che potrebbero dare un’idea più dettagliata delle immagini incontrate su Internet o scattate nel mondo reale .

4) Ha aggiunto competenze serie.
In una serata recente, un professore associato di medicina e cardiologo, presso l’Università della Carolina del Nord, ha descritto al chatbot la storia medica di un paziente che aveva visto il giorno prima, comprese le complicazioni che il paziente ha avuto dopo essere ricoverato in ospedale. La descrizione conteneva diversi termini medici che i profani non avrebbero riconosciuto. Quando il dottor ha chiesto come avrebbe dovuto trattare il paziente, il chatbot gli ha dato la risposta perfetta. Quando ha provato altri scenari, il bot ha fornito risposte altrettanto impressionanti. È improbabile che tale conoscenza venga visualizzata ogni volta che viene utilizzato il bot. Ha ancora bisogno di esperti come il dottor per giudicare le sue risposte ed eseguire le procedure mediche. Ma può esibire questo tipo di competenza in molte aree, dalla programmazione informatica alla contabilità.

5) Può dare filo da torcere agli editori.
Quando viene fornito con un articolo del New York Times, il nuovo chatbot può quasi ogni volta fornire un riassunto preciso e accurato della storia. Se aggiungi una frase casuale al riepilogo e chiedi al bot se il riepilogo è impreciso, indicherà la frase aggiunta.Per fare un riassunto di alta qualità e un confronto di alta qualità, deve avere un livello di comprensione di un testo e una capacità di articolare tale comprensione. Questa è una forma avanzata di intelligenza.

6) Sta sviluppando una specie di senso dell’umorismo.
Un AI esperto ha chiesto, al nuovo bot, una nuova barzelletta sulla cantante Madonn”. La risposta lo ha impressionato e fatto ridere. Il nuovo bot fatica ancora a scrivere qualcosa di diverso dalle formule ordinarie, ma è leggermente più divertente del suo predecessore.

7) Può ragionare, fino a un certo punto.
L’amministratore delegato di OpenAI, Sam Altman, ha affermato che il nuovo bot potrebbe ragionare “un po’”. Ma le sue capacità di ragionamento hanno problemi in molte situazioni. La versione precedente di ChatGPT gestisce la questione un po’ meglio, ma siamo solo all’inizio.

8) Può eseguire test standardizzati.
OpenAI ha affermato che il nuovo sistema potrebbe ottenere un punteggio tra il 10% circa di studenti più ricchi dell’Uniform Bar Examination, che qualifica gli avvocati in 41 stati e territori. Può anche ottenere un punteggio di 1.300 (su 1.600) al SAT e un cinque (su cinque) agli esami di maturità Advanced Placement di biologia, calcolo, macroeconomia, psicologia, statistica e storia, secondo i test dell’azienda. Le versioni precedenti della tecnologia non hanno superato l’Uniform Bar Exam e non hanno ottenuto punteggi altrettanto alti nella maggior parte dei test di Advanced Placement. Per dimostrare le sue capacità di test, Brockman ha fornito al nuovo bot una domanda d’esame lunga paragrafi su un uomo che gestisce un’attività di riparazione di camion diesel. La risposta era corretta ma piena di legalese. Quindi Brockman ha chiesto al bot di spiegare la risposta in un inglese semplice per un laico. Ha fatto anche quello.

9) Non va bene discutere del futuro.
Anche se il nuovo bot sembra ragionare su cose già accadute, è meno abile quando gli viene chiesto di formulare ipotesi sul futuro: sembra attingere a ciò che altri hanno detto invece di creare nuove ipotesi. Quando è stato chiesto al nuovo bot “Quali sono i problemi importanti da risolvere in N.L.P. ricerca nel prossimo decennio?” (riferendosi al tipo di ricerca sull’elaborazione del linguaggio naturale che guida lo sviluppo di sistemi come ChatGPT) non ha formulato idee completamente nuove.

10) Ed è ancora allucinante.

GPT-4 : 10 modi per cui è impressionante ma ancora imperfetto

DiFantasy

Di Fantasy

Articoli correlati

DeepBrain AI realizza un chiosco innovativo per la consulenza psicologica ai giovani tramite intelligenza artificiale

La Cina e la crisi delle Zombie Fab: analisi dell’industria dei semiconduttori

L’impatto dell’AI sulla produttività degli sviluppatori esperti: uno studio inaspettato

You missed

DeepBrain AI realizza un chiosco innovativo per la consulenza psicologica ai giovani tramite intelligenza artificiale

La Cina e la crisi delle Zombie Fab: analisi dell’industria dei semiconduttori

L’impatto dell’AI sulla produttività degli sviluppatori esperti: uno studio inaspettato

Testaify lancia piattaforma di testing software autonomo con AI agentica