La seconda prova della maturità 2025, quella di matematica per il liceo scientifico, ha messo alla prova non solo gli studenti, ma anche le intelligenze artificiali più avanzate. Un esperimento condotto da InfoData ha coinvolto quattro modelli di AI—ChatGPT, Gemini, DeepSeek e Claude—per risolvere i problemi matematici dell’esame. Il risultato? Un fallimento collettivo, con valutazioni che raramente superano la sufficienza.
Il professor Domenico Brunetto, docente di matematica al Politecnico di Milano, ha esaminato le risposte fornite dai modelli. Gemini, sviluppato da Google, ha mostrato la sua limitazione principale: la necessità di trascrivere il testo dei problemi in formato digitale, poiché non è in grado di “vedere” o elaborare direttamente le immagini. Questo rende l’uso dell’AI poco pratico in un contesto d’esame, dove il tempo è limitato.
ChatGPT ha affrontato le domande con un approccio superficiale, trascurando il secondo problema e commettendo errori semantici, come confondere “f^-1” (l’inverso di una funzione) con “f alla meno uno”. Questi errori, probabilmente derivanti dall’elaborazione delle immagini, hanno portato a una valutazione di 1 su 10.
Claude ha mostrato una comprensione imprecisa dei concetti, utilizzando termini come “derivate laterali”, che non sono riconosciuti nel linguaggio matematico italiano o inglese. Questo ha suscitato perplessità tra i docenti, risultando in un punteggio di 4.
DeepSeek, un modello cinese, ha ottenuto il punteggio più alto: 6. Le sue risposte erano concise e puntuali, ma l’uso di concetti come i prodotti scalari per verificare se un triangolo è rettangolo ha sollevato dubbi, poiché la maggior parte degli studenti avrebbe utilizzato il teorema di Pitagora.
In generale, l’esperimento ha evidenziato le limitazioni attuali dell’intelligenza artificiale nell’affrontare compiti complessi come quelli della maturità. Il professor Brunetto ha suggerito che un prompt più preciso, che fornisse maggiore contesto all’AI, potrebbe migliorare i risultati. Tuttavia, ha concluso che sarebbe più efficace dedicare quel tempo allo studio diretto.