Moderare le aspettative per GPT-4

L’hype può essere pericoloso. Troppa eccitazione può influire sulle tue azioni, uccidere il lancio del tuo prodotto e rovesciare l’eccitazione. L’ondata di entusiasmo per l’IA generativa che OpenAI sta cavalcano è diventata una vera e propria introduzione agli LLM per la maggior parte del mondo, e ha attirato l’attenzione di tutti su OpenAI e Sam Altman.

Quando Altman ha confermato per la prima volta che OpenAI stava effettivamente costruendo il successore del suo modello di riferimento GPT3, la comunità AI era entusiasta. GPT3 era un modello linguistico all’avanguardia con 175 miliardi di parametri, che deteneva il record per il più grande modello di intelligenza artificiale di sempre. E dalla sua uscita nel 2020, la speculazione è stata diffusa intorno a GPT4. Potrebbe essere più grande, più veloce, più intelligente? Può essere esente da risposte errate? Sembrava che solo un prodotto perfetto potesse soddisfare le aspettative.

Tuttavia, Altman ha ammesso che GPT4 non è un modello perfetto. “È ancora difettoso, ancora limitato e sembra ancora più impressionante al primo utilizzo rispetto a quando ci passi più tempo”, ha twittato dicendo “apprezziamo molto il feedback sui suoi difetti” ai suoi follower su Twitter.

Inoltre, Altman ha ammesso di non essersi aspettato la reazione che è seguita al rilascio di ChatGPT. ‘Posso capire perché DALL-E ha sorpreso le persone, ma ero sinceramente confuso sul motivo per cui ChatGPT lo ha fatto. Abbiamo pubblicato GPT-3 quasi tre anni fa, l’abbiamo inserito in un’API e l’aggiornamento incrementale da quello a ChatGPT avrebbe dovuto essere prevedibile e vogliamo fare più introspezione sul motivo per cui sono stato calibrato male su questo “, ha aggiunto.

ChatGPT funziona su GPT 3.5. OpenAI aveva pianificato che questo modello andasse leggermente sotto il radar poiché doveva essere un precursore di GPT4. Poiché ChatGPT ha massificato il modello, la persona media che utilizza GPT4 potrebbe trovarlo non molto diverso da GPT 3.5 (ChatGPT).

Altman ha anche affermato di aspettarsi meno clamore e meno utenti per GPT4 rispetto a quando si sono preparati a rilasciare ChatGPT al mondo. “Meno clamore è probabilmente meglio come regola generale. Una delle cose strane di queste tecnologie è che sono impressionanti ma non robuste. Usali in una demo che pensi ‘buona per andare’, ma usali a lungo termine e vedi i punti deboli. Ma andrà meglio”, ha detto.

Altman era molto consapevole di quanto fossero in realtà fallibili gli LLM. Hanno molte allucinazioni, così come GPT4, ma meno dei suoi predecessori

OpenAI aveva imparato la lezione dal lancio di Bard di Google e ha descritto attentamente la distinzione tra GPT-3.5 e GPT4 durante il suo lancio. Secondo OpenAI, GPT4 ha l’82% in meno di probabilità di rispondere a richieste di contenuti non consentiti da OpenAI e il 60% in meno di probabilità di avere allucinazioni. GPT4 supera di un miglio ChatGPT su test umani come l’Uniform Bar Exam e nelle Biology Olympiad.

Oren Etzioni, CEO e fondatore dell’Allen Institute for AI, ha definito il modello un punto di riferimento. “I continui miglioramenti lungo molte dimensioni sono notevoli. GPT-4 è ora lo standard in base al quale verranno valutati tutti i modelli di fondazione”, ha affermato.

Nonostante le aspettative degli utenti per GPT4, Altman ha fatto molto per moderarle. Durante un’intervista a gennaio, ha dichiarato che “le persone chiedono di essere deluse e lo saranno”. Ha anche negato i rumors che il modello avrebbe avuto più di 100 trilioni di parametri.

In sintesi, anche se GPT4 è stato atteso con grande eccitazione, Altman ha moderato le aspettative e ammesso che il modello ha ancora dei difetti. Nonostante ciò, GPT4 è uno dei migliori modelli di intelligenza artificiale sul mercato e un punto di riferimento per valutare i modelli futuri.

Moderare le aspettative per GPT-4

DiFantasy

Di Fantasy

Articoli correlati

Microsoft porterà i sistemi AMD Helios nei data center Azure

Korea Wide introduce l’AI DVR di Aimatics su tutta la flotta di autobus interurbani

Archer e Anduril presentano Thunder, il drone militare VTOL per affiancare gli elicotteri Apache

Ultimi Post

Microsoft porterà i sistemi AMD Helios nei data center Azure

Korea Wide introduce l’AI DVR di Aimatics su tutta la flotta di autobus interurbani

Archer e Anduril presentano Thunder, il drone militare VTOL per affiancare gli elicotteri Apache

Motif-3 raggiunge 44 punti AAII con un modello da 314 miliardi di parametri