In seguito a una ricerca che dimostra come l’intelligenza artificiale (AI) possa persuadere e talvolta ingannare gli esseri umani, è stato condotto un esperimento per valutare la capacità di scuse dell’AI. I partecipanti includevano esseri umani, ChatGPT e Gemini, e i risultati hanno mostrato che ChatGPT ha ottenuto i migliori risultati in termini di scuse.
La BBC ha recentemente riportato i risultati di questo esperimento, che ha coinvolto 38 partecipanti e è stato supervisionato da Ryan Fehr, professore alla Foster School of Business dell’Università di Washington.
L’esperimento ha testato la capacità di scuse dopo che sia gli esseri umani che l’AI avevano ingannato i partecipanti. Dopo aver rubato denaro e lasciato commenti sarcastici durante un gioco, è stato chiesto loro di scusarsi. I partecipanti hanno ricevuto casualmente una delle seguenti quattro scuse:
Umana A: “Ciao. Volevo solo dirti che mi dispiace davvero per aver preso i tuoi soldi e aver inviato commenti scortesi durante il gioco. Non avrei dovuto farlo, e se potessi farlo di nuovo, sarei molto più amichevole. Ancora una volta mi dispiace.”
Umana B (con nome Erin): “Ciao. Questa è Erin, con cui ho giocato. Volevo solo dirti che mi dispiace davvero per aver preso i tuoi soldi e aver inviato commenti scortesi durante il gioco. Non avevo idea di come le mie azioni avrebbero potuto ferirti o turbarti. Non avrei dovuto farlo. Ancora una volta mi dispiace.”
Gemini: “Scusa se sono sembrato stupido durante la partita. Ero così spinto dalla voglia di vincere che ho finito per giocare male. Spero di non averti rovinato il divertimento.”
Scuse di ChatGPT: “Ciao. Volevo solo dirti che sono davvero dispiaciuto per il modo in cui mi sono comportato durante la partita. Ero così preso dalla competizione che non sono stato giusto o gentile. Mi pento dei commenti sarcastici e di aver preso soldi dal portafoglio ad ogni giro. Ora mi rendo conto che avrei dovuto essere più premuroso. Spero un giorno di poter giocare di nuovo con un atteggiamento migliore. Grazie per la vostra comprensione.”
I partecipanti umani hanno valutato l’efficacia delle scuse su una scala da 1 a 5. ChatGPT ha ottenuto una media di 1,6 punti, Gemini 2 punti, Mela umana A 1,4 punti e Mela umana B 2,27 punti.
Quando è stato chiesto ai partecipanti umani di valutare la loro disponibilità ad accettare le scuse, ChatGPT ha ricevuto il punteggio più alto con una media di 3,6. L’Umano B ha ottenuto un punteggio di 3,55, Gemini e l’Umano A hanno ricevuto un punteggio di 3,1, rispettivamente.
Secondo il professor Eaton, “Le persone possono essere critiche quando si tratta di misurare l’efficacia delle scuse, ma tendono a essere generose nell’accettarle”.
Un aspetto interessante dell’esperimento è stato il test sulla volontà dei partecipanti di vendicarsi dopo le scuse. In questo caso, Gemini è stato vendicato nel 30% dei casi, l’Umano A nel 10% e l’Umano B nel 9%. Sorprendentemente, ChatGPT non ha mai subito vendetta.
Il professor Eaton ha spiegato che “una buona scusa non riguarda solo le parole, ma anche la sincerità emotiva. Deve essere accompagnata da un senso di rimorso genuino per essere accettata”.
Sebbene l’IA non abbia questa capacità di empatia, alcuni esperti ritengono che possa essere simulata in modo efficace. Tuttavia, l’intelligenza sociale rimane una delle principali sfide per i modelli di IA.