Dal cinema alla realtà: l’evoluzione della polizia pre-crimine di Minority Report grazie alla generazione di immagini dal cervello

Il successo fantascientifico di Steven Spielberg del 2002 Minority Report ha mostrato un’immaginaria “polizia pre-crimine” che sarebbe stata in grado di prevenire i futuri crimini grazie alla chiaroveggenza di tre esseri umani, i precog, geneticamente modificati per prevedere il crimine futuro. Questo concetto, sebbene ancora lontano dall’essere realizzato, sta avanzando grazie alla generazione di immagini dal cervello umano.

Recentemente, due ricercatori giapponesi, Yu Takagi e Shinji Nishimoto, hanno presentato un documento in cui hanno utilizzato modelli di diffusione (DM) come Stable Diffusion per generare immagini ad alta risoluzione dall’attività del cervello umano. Questo studio utilizza l’fMRI per ricostruire le esperienze visive dalle attività del cervello umano e comprendere come un cervello umano elabora le informazioni visive.

L’fMRI misura l’attività cerebrale rilevando i cambiamenti associati al flusso sanguigno e combina il flusso sanguigno cerebrale con l’attivazione neuronale. Questa tecnica è stata utilizzata per ricostruire le immagini ad alta risoluzione con alta fedeltà, senza la necessità di formazione aggiuntiva o messa a punto di modelli di apprendimento profondo complessi.

Ci sono stati precedenti tentativi di ricostruire immagini visive dall’fMRI, ma gli studi più recenti utilizzano modelli generativi profondi addestrati su un gran numero di immagini naturalistiche. Tuttavia, la formazione e la messa a punto di questi modelli sono impegnativi a causa della dimensione del campione nelle neuroscienze, che è piccola. Tuttavia, DM e LDM (modelli di diffusione latente) possono generare immagini ad alta risoluzione con un’elevata fedeltà semantica del condizionamento del testo e un’elevata efficienza computazionale.

Il modello LDM è in grado di imparare a creare immagini partendo da un semplice modello di rumore e trasformarlo gradualmente in un’immagine complessa simile ai dati di addestramento. Ogni componente di un LDM viene interpretato quantitativamente da una prospettiva neuroscientifica mappando componenti specifici a regioni cerebrali distinte.

Tuttavia, è importante notare che questo modello non è addestrato per interpretare pensieri e parole. Il modello è un’estensione AI di studi precedenti sulla mappatura del cervello tramite fMRI o EEG, in cui la macchina di imaging è in grado di rilevare solo ampi schemi di attività. Il modello proposto è ancora nelle fasi nascenti dell’interpretazione delle attività cerebrali.

L’implementazione di questa tecnologia potrebbe portare progressi nel campo medico, dove la mappatura del cervello è già utilizzata nella diagnosi e nella comprensione delle malattie dei pazienti. Inoltre, potrebbe anche essere utile in ambiti come la testimonianza oculare nel crimine, dove la descrizione del sospettato può essere influenzata dallo stato mentale e dall’ambiente circostante del testimone. Con questo modello, il ricordo del sospettato da parte del testimone oculare o della vittima potrebbe diventare più accurato.

Tuttavia, l’implementazione di questa tecnologia solleva anche questioni etiche sulla lettura della mente. È importante garantire che queste tecnologie siano utilizzate in modo etico e non violino la privacy o i diritti umani. Inoltre, è importante considerare la possibilità di errori e falsi positivi nell’interpretazione delle attività cerebrali.

In definitiva, il lavoro dei ricercatori Yu Takagi e Shinji Nishimoto rappresenta un passo avanti nella generazione di immagini dal cervello umano e ha il potenziale per portare progressi nella comprensione del funzionamento del cervello e nella diagnosi medica. Tuttavia, è importante considerare le implicazioni etiche e garantire che queste tecnologie siano utilizzate in modo responsabile.

Dal cinema alla realtà: l’evoluzione della polizia pre-crimine di Minority Report grazie alla generazione di immagini dal cervello

DiFantasy

Di Fantasy

Articoli correlati

Microsoft Edge si trasforma in un browser AI con la modalità Copilot

SK Telecom lancia AX Encoder e AX 4.0 VL Lite: nuovi modelli AI per l’interpretazione documentale e la comprensione visivo-linguistica

Sutra HiFi: l’AI vocale multilingue che parla come un umano

You missed

Microsoft Edge si trasforma in un browser AI con la modalità Copilot

SK Telecom lancia AX Encoder e AX 4.0 VL Lite: nuovi modelli AI per l’interpretazione documentale e la comprensione visivo-linguistica

Sutra HiFi: l’AI vocale multilingue che parla come un umano

Fractal lancia Cogentiq: l’intelligenza artificiale che agisce per le imprese