Questo modello AI può capire i videogiochi dalla copertina
Recentemente, i ricercatori della Western Kentucky University hanno proposto un framework di apprendimento profondo multimodale che ha la capacità di classificare i generi di videogiochi in base alla copertina e alla descrizione testuale. I ricercatori hanno affermato che questa ricerca è il primo tentativo in assoluto di classificazione automatica dei generi utilizzando un approccio di apprendimento profondo .
I videogiochi sono stati una delle forme di intrattenimento più diffuse, redditizie e importanti in tutto il mondo. Inoltre, il genere e i suoi sistemi di classificazione svolgono un ruolo significativo nello sviluppo dei videogiochi.
Secondo i ricercatori, le copertine dei videogiochi e le descrizioni testuali sono solitamente la prima impressione per i suoi consumatori e spesso trasmettono informazioni importanti sui videogiochi.
Tuttavia, i ricercatori spesso trovano difficile classificare i generi di videogiochi in base alla copertina e alla descrizione testuale a causa di vari motivi come un numero enorme di generi di videogiochi, molti dei quali non sono definiti concretamente; disegni di copertina; e descrizioni testuali che possono variare a causa di molti fattori esterni come paese, cultura e altri simili.
Inoltre, con la crescente competitività nel settore dei videogiochi, i designer di copertine e i tipografi spingono i design delle copertine al limite nella speranza di attirare le vendite. Per mitigare tali problemi, i ricercatori hanno costruito questo nuovo framework di apprendimento profondo .
La tecnologia dietro
Per questo, i ricercatori miravano a sviluppare tre algoritmi di deep learning per il compito di classificazione del genere dei videogiochi, che sono-
Un approccio basato sulle immagini utilizzando le copertine del gioco
Un approccio basato sul testo che utilizza le descrizioni testuali
Un approccio multimodale che utilizza sia le copertine del gioco che la descrizione testuale
Hanno valutato cinque modelli basati su immagini e due modelli basati su testo utilizzando metodi di apprendimento a trasferimento profondo per l’attività di classificazione del genere dei videogiochi. I modelli basati su immagini includono MobileNet-V1, MobileNet-V2, Inception-V1, Inception-V2 e ResNet-50. Inoltre, i due modelli basati su testo includono reti neurali ricorrenti (RNN) con memoria a lungo termine (LSTM).
Oltre alle immagini di copertina dei videogiochi, hanno utilizzato anche le descrizioni dei giochi per la classificazione dei generi. Lo scopo principale della descrizione del gioco è esprimere gli oggetti coinvolti in un gioco e l’insieme di regole che inducono le transizioni, risultando in uno spazio di stato-azione.
Nella fase finale, i ricercatori hanno considerato un’architettura di apprendimento profondo multimodale basata sia sulla copertina del gioco che sulla descrizione per il compito di classificazione del genere. Questo approccio prevede ancora due passaggi, che sono:
Una rete neurale viene addestrata sul compito di classificazione per ciascuna modalità
Le rappresentazioni intermedie vengono estratte da ciascuna rete e combinate in una fase di apprendimento multimodale.
Secondo i ricercatori, le informazioni di entrambe le modalità vengono quindi combinate utilizzando il metodo di concatenazione e quindi hanno contribuito ad aumentare il tasso di accuratezza della classificazione.
Set di dati utilizzato
Per eseguire questa ricerca, i ricercatori hanno creato un ampio set di dati di 50.000 videogiochi che include immagini di copertina del gioco, testo descrittivo, testo del titolo e informazioni sul genere da IGDB.com, un database di videogiochi.
C’erano in totale 21 generi trovati nel dataset originale; tuttavia, hanno sfornato 15 generi diversi, come avventura, arcade, combattimento, strategia, tra gli altri. Il set di dati raccolto può essere utilizzato per una serie di studi come il riconoscimento del testo da immagini, l’estrazione automatica di argomenti e altri simili.
Contributi di questa ricerca
I ricercatori hanno contribuito a questa ricerca in quattro modi:
In primo luogo, hanno compilato un ampio set di dati composto da 50.000 videogiochi di 21 generi composti da immagini di copertina, testo descrittivo, testo del titolo e informazioni sul genere.
In secondo luogo, i modelli all’avanguardia basati su immagini e testo vengono valutati a fondo per il compito di classificazione di genere per i videogiochi.
In terzo luogo, hanno sviluppato un efficiente framework multimodale basato su immagini e testi.
Infine, viene mostrata dai ricercatori un’analisi approfondita dei risultati sperimentali e viene suggerito anche il lavoro futuro per migliorare le prestazioni.