Da sempre Minecraft è terreno fertile per creazioni strabilianti: castelli sospesi, macchine elaborate, circuiti in Redstone. Ma raramente ha visto un esperimento come CraftGPT, un linguaggio artificiale costruito dentro il gioco. Immagina un modello di intelligenza artificiale — un piccolo modello linguistico — non come codice che gira su un PC, ma come un complesso agglomerato di blocchi Minecraft che funzionano da circuiti: tokenizzatori, moltiplicatori di matrici, memorie, logica aritmetica, tutto realizzato con la meccanica interna di Redstone. È quello che lo sviluppatore “sammyuri” ha proposto su GitHub, come dimostrazione che anche in un mondo fatto di cubi si può “installare” un modello IA.
La struttura è impressionante: il macchinario copre un’area di 1.020 blocchi in orizzontale, per 260 in altezza e 1.656 in profondità — un totale di circa 439 milioni di blocchi impiegati per costruire l’hardware in-gioco del modello.
All’interno di questa massa di blocchi, ogni elemento svolge un ruolo: “cavi” Redstone che veicolano segnali, contatori che scandiscono i cicli, vettori che accumulano valori, componenti che moltiplicano matrici. È un’interpretazione fisica (anzi, cubica) della matematica del calcolo neurale.
Il modello impiegato — un modello “leggero” con poco più di 5,087,280 parametri — è stato addestrato fuori da Minecraft, in Python, utilizzando un dataset base di conversazioni in inglese chiamato TinyChat.
È composto da 6 strati (layers), ha uno spazio di embedding di dimensione 240 e un vocabolario di 1.920 token. Per mantenere l’hardware giocoso relativamente “leggero”, alcuni pesi — come quelli d’embedding o la normalizzazione — sono memorizzati a 18 o 24 bit, mentre la maggior parte dei parametri è quantizzata a
Naturalmente, l’uso del modello nel gioco è estremamente lento. Anche rispondere a una domanda semplice può richiedere ore, anche con server Redstone ad alte prestazioni (ad esempio MCHPRS, una versione “spinta” del motore Redstone). In modalità “vanilla” di Minecraft, senza ottimizzazioni, l’autore avverte che potrebbe volerci persino anni per ottenere una risposta.
Sammyuri stesso avverte che non aspettarsi prestazioni da modello “produttivo” è la miglior mentalità: le risposte possono deviare dal tema, contenere errori grammaticali o semplicemente essere incomprensibili.
Un video pubblicato dallo sviluppatore mostra passo dopo passo l’assemblaggio del dispositivo: ogni parte è costruita, testata, collegata, come se si stesse montando un PC reale — ma tutto è fatto con torce, ripetitori, polvere di Redstone, blocchi solidi. Nel video si vedono i tokenizzatori, i moduli di moltiplicazione, i contatori, le sezioni di output, tutti integrati nel gigantesco apparecchio.
Dietro questo progetto c’è molto più che la meraviglia dell’assurdo. CraftGPT mette in luce alcune lezioni profonde:
- La fisicità del calcolo: quando traduci operazioni lineari in strutture spaziali, ogni costo — latenza, propagazione dei segnali, aggiornamenti, sincronizzazione — diventa tangibile. Non è più “astratto” che una moltiplicazione costi un ciclo: la vedi estendersi nel mondo a blocchi.
- Separazione tra addestramento e inferenza: il modello è addestrato esternamente, ma l’inferenza (cioè il processo di risposta) è implementata in Redstone. Questo richiama come, anche nei sistemi reali, l’addestramento e l’uso siano spesso disaccoppiati.
- Limiti pratici diventano materiali: il contesto ridotto (solo 64 token) è una limitazione condivisa: nei moderni modelli IA si tende a voler contesti ampi, ma qui anche 64 token sono sfida. E quantizzare pitch e pesi per adattarli ai blocchi è un vincolo reale.
- Didattica estrema: vedere un modello “in carne e ossa” (anzi, mattoni e polvere) può aiutare la comprensione: sai dove passa ogni bit, come si somma, come si moltiplica, come si propaga il segnale. Non è solo uno strumento concettuale: è un “modello che puoi percorrere a piedi”.
Certamente, CraftGPT non è destinato a sostituire modelli IA pratici. È piuttosto un esperimento di ingegneria visionaria, una provocazione: fino a che punto si può “materializzare” l’astrazione? Aiuta a rendere visibili le parti nascoste del modello.