il Brasile è chiaramente il favorito per la Coppa del Mondo FIFA
Domenica prossima, 20 novembre, le squadre di calcio maschile inizieranno la Coppa del Mondo FIFA in Qatar. Il favorito questa volta è il Brasile con una probabilità di vittoria del 15%. È quanto afferma un team internazionale di ricercatori composto da Andreas Groll e Neele Hormann (entrambi TU Dortmund), Gunther Schauberger (TU Munich), Christophe Ley (University of Luxembourg), Hans Van Eetvelde (University of Ghent) e Achim Zeileis (University of Innsbruck) ha dimostrato con l’aiuto del machine learning. La loro previsione combina diversi modelli statistici per la forza di gioco delle squadre con informazioni sulla struttura della squadra (come il valore di mercato o il numero di giocatori della Champions League) e fattori socio-economici del paese di origine (popolazione o prodotto interno lordo). “Questa volta, la Coppa del Mondo è offuscata da molti problemi etici e sportivi che non possiamo ignorare. Tuttavia, per ragioni scientifiche, abbiamo deciso di utilizzare il nostro approccio di apprendimento automatico, che abbiamo utilizzato con successo nei tornei precedenti, per fare previsioni probabilistiche”, afferma Achim Zeileis.
100.000 simulazioni
Con i valori previsti dal modello dei ricercatori, l’intera Coppa del Mondo è stata simulata 100.000 volte: partita per partita, seguendo il sorteggio del torneo e tutte le regole FIFA. Ciò si traduce in probabilità per tutte le squadre di avanzare ai diversi turni del torneo e alla fine vincere il campionato. Questa volta il favorito è il Brasile con una probabilità di vittoria del 15 per cento, seguito da Argentina (11,2 per cento), Paesi Bassi (9,7 per cento), Germania (9,2 per cento) e Francia (9,1 per cento). è collegato di seguito. Naturalmente, il torneo è ben lungi dall’essere predeterminato, come dimostra la probabilità di vincita relativamente bassa delle migliori squadre. “È nella natura stessa delle previsioni che possono anche essere errate, altrimenti i tornei di calcio sarebbero molto noiosi. Forniamo probabilità, non certezze, e una probabilità di vincita del 15 percento implica anche una probabilità di non vincita dell’85 percento”, spiega Andreas Groll. Finora, tuttavia, le previsioni hanno avuto un discreto successo: il modello Innsbruck di Achim Zeileis, che si basa sulle quote dei bookmaker aggiustate, è stato in grado di prevedere correttamente la finale di EURO nel 2008, così come la Spagna campione del mondo e d’Europa nel 2010 e nel 2012 Quest’anno il modello di Zeileis sarà utilizzato per la seconda volta dopo EURO 2021 come parte di un modello combinato più completo sviluppato dai team di Andreas Groll (TU Dortmund), Gunther Schauberger (TU Monaco) e Christophe Ley (Università del Lussemburgo ), che ha superato la qualità delle previsioni dei fornitori di scommesse ai Mondiali 2018.
La Coppa del Mondo 2022 è interessante per i ricercatori da un punto di vista scientifico a causa della data insolita – il torneo ha dovuto essere rinviato ai mesi invernali a causa delle temperature estremamente elevate in Qatar in estate: “Oltre ai problemi etici ampiamente discussi di questa Coppa del Mondo, ciò solleva anche questioni sportive molto critiche: nei mesi invernali, tutti i principali campionati di calcio in Europa e Sud America devono interrompere il loro consueto programma di partite per accogliere il torneo. Questo dà alle squadre nazionali meno tempo per prepararsi e ai giocatori meno tempo per recuperare prima e dopo la Coppa del Mondo. In combinazione con le condizioni climatiche estreme, questo aumenta anche il rischio di lesioni”, spiega Achim Zeileis. Avere una squadra con molti giocatori nei campionati internazionali – come Champions League, Europa League,
In quanto appassionati di calcio, i ricercatori sono sgomenti per le circostanze in cui quest’anno si svolge la Coppa del Mondo, sottolinea Achim Zeileis: “La solita gioia e attesa di una Coppa del Mondo è stata schiacciata dalle terribili circostanze di quest’anno: dalla presunta corruzione nel processo di selezione degli host, ai diritti umani e alle condizioni di lavoro in Qatar, e alla mancanza di sostenibilità nella costruzione e nel funzionamento degli stadi”.
Apprendimento automatico
Il calcolo dei ricercatori si basa su quattro fonti di informazione: un modello statistico per la forza di gioco di ciascuna squadra basato su tutte le partite internazionali degli ultimi otto anni (Università di Gand e Lussemburgo), un altro modello statistico per la forza di gioco delle squadre sulla base delle quote di scommessa di 28 bookmaker internazionali (Università di Innsbruck) e ulteriori informazioni sulle squadre, ad esempio il valore di mercato, e i loro paesi di origine, come la dimensione della popolazione (TU Dortmund e TU Monaco). La quarta fonte o “partner” è un modello di apprendimento automatico che combina le diverse fonti e le ottimizza passo dopo passo. I ricercatori hanno precedentemente addestrato il modello con dati storici, come spiega Andreas Groll: “Abbiamo alimentato il modello con i dati attuali degli ultimi cinque Mondiali, ovvero tra il 2002 e il 2018, e confrontato con i risultati effettivi di tutte le partite nei rispettivi tornei: in questo modo, la ponderazione delle singole fonti di informazione per il torneo in corso sarà idealmente molto accurata”. Per inciso, il modello addestrato in questo modo può essere utilizzato anche per altre previsioni in futuro, quindi una migliore previsione calcistica potrebbe eventualmente fornire anche previsioni meteorologiche più accurate. In ogni caso, entro la sera del 18 dicembre scopriremo le prestazioni del modello in termini di previsioni del calcio. il modello addestrato in questo modo può essere utilizzato anche per altre previsioni in futuro, quindi una migliore previsione calcistica potrebbe eventualmente fornire anche previsioni meteorologiche più accurate. In ogni caso, entro la sera del 18 dicembre scopriremo le prestazioni del modello in termini di previsioni del calcio. il modello addestrato in questo modo può essere utilizzato anche per altre previsioni in futuro, quindi una migliore previsione calcistica potrebbe eventualmente fornire anche previsioni meteorologiche più accurate. In ogni caso, entro la sera del 18 dicembre scopriremo le prestazioni del modello in termini di previsioni del calcio.