Diagnosi dei disturbi della salute mentale attraverso la valutazione dell’espressione facciale AI
I ricercatori tedeschi hanno sviluppato un metodo per identificare i disturbi mentali basato sulle espressioni facciali interpretate dalla visione artificiale .
Il nuovo approccio non solo può distinguere tra soggetti sani e affetti, ma può anche distinguere correttamente la depressione dalla schizofrenia, nonché il grado in cui il paziente è attualmente affetto dalla malattia.
I ricercatori hanno fornito un’immagine composita che rappresenta il gruppo di controllo per i loro test (a sinistra nell’immagine sotto) e i pazienti che soffrono di disturbi mentali (a destra). Le identità di più persone si fondono nelle rappresentazioni e nessuna delle due immagini raffigura un particolare individuo:
Gli individui con disturbi affettivi tendono ad avere sopracciglia alzate, sguardi plumbei, facce gonfie ed espressioni con la bocca da cane. Per tutelare la privacy dei pazienti, queste immagini composite sono le uniche messe a disposizione a supporto del nuovo lavoro.
Finora, il riconoscimento degli affetti facciali è stato utilizzato principalmente come potenziale strumento per la diagnosi di base. Il nuovo approccio, invece, offre un possibile metodo per valutare i progressi del paziente durante il trattamento, oppure (potenzialmente, anche se il documento non lo suggerisce) nel proprio ambiente domestico per il monitoraggio ambulatoriale.
Il documento afferma*:
“Andando oltre la diagnosi automatica della depressione nell’informatica affettiva, che è stata sviluppata in studi precedenti , dimostriamo che lo stato affettivo misurabile stimato mediante la visione artificiale contiene molte più informazioni rispetto alla pura classificazione categoriale”.
I ricercatori hanno soprannominato questa tecnica encefalografia optoelettronica (OEG), un metodo completamente passivo per dedurre lo stato mentale mediante l’analisi dell’immagine facciale anziché sensori topici o tecnologie di imaging medico basate sui raggi.
Gli autori concludono che l’OEG potrebbe potenzialmente non essere solo un mero aiuto secondario alla diagnosi e al trattamento, ma, a lungo termine, un potenziale sostituto di alcune parti valutative della pipeline del trattamento e che potrebbe ridurre il tempo necessario per il paziente monitoraggio e diagnosi iniziale. Notano:
‘Nel complesso, i risultati previsti dalla macchina mostrano correlazioni migliori rispetto ai questionari basati sulla valutazione dell’osservatore clinico puro e sono anche obiettivi. Degno di nota è anche il periodo di misurazione relativamente breve di pochi minuti per gli approcci di visione artificiale, mentre a volte sono necessarie ore per i colloqui clinici.’
Tuttavia, gli autori desiderano sottolineare che la cura del paziente in questo campo è una ricerca multimodale, con molti altri indicatori dello stato del paziente da considerare oltre alle sole espressioni facciali, e che è troppo presto per considerare che un tale sistema potrebbe sostituire completamente gli approcci tradizionali ai disturbi mentali. Tuttavia, considerano l’OEG una promettente tecnologia aggiuntiva, in particolare come metodo per classificare gli effetti del trattamento farmaceutico nel regime prescritto dal paziente.
L’ articolo è intitolato The Face of Affective Disorders e proviene da otto ricercatori di un’ampia gamma di istituzioni del settore della ricerca medica privata e pubblica.
Dati
(Il nuovo articolo tratta principalmente le varie teorie e metodi che sono attualmente diffusi nella diagnosi dei pazienti con disturbi mentali, con meno attenzione del solito alle tecnologie e ai processi effettivi utilizzati nei test e nei vari esperimenti)
La raccolta dei dati si è svolta presso l’ospedale universitario di Aquisgrana, con 100 pazienti equilibrati per genere e un gruppo di controllo di 50 persone non affette. I pazienti includevano 35 malati di schizofrenia e 65 persone che soffrivano di depressione.
Per la parte dei pazienti del gruppo di test, le misurazioni iniziali sono state effettuate al momento del primo ricovero e il secondo prima della dimissione dall’ospedale, in un intervallo medio di 12 settimane. I partecipanti al gruppo di controllo sono stati reclutati arbitrariamente dalla popolazione locale, con la propria induzione e “dimissione” che rispecchiavano quella dei pazienti reali.
In effetti, la “verità di base” più importante per un tale esperimento deve essere la diagnosi ottenuta con metodi approvati e standard, e questo è stato il caso delle prove OEG.
Tuttavia, la fase di raccolta dei dati ha ottenuto dati aggiuntivi più adatti all’interpretazione della macchina: interviste della durata media di 90 minuti sono state acquisite in tre fasi con una webcam consumer Logitech c270 in esecuzione a 25 fps.
La prima sessione comprendeva un’intervista standard di Hamilton (basata su una ricerca originata intorno al 1960), come sarebbe normalmente data all’ammissione. Nella seconda fase, insolitamente, ai pazienti (e alle loro controparti nel gruppo di controllo) sono stati mostrati i video di una serie di espressioni facciali e gli è stato chiesto di imitare ciascuna di esse, pur affermando la propria stima della loro condizione mentale in quel momento, incluso stato emotivo e intensità. Questa fase è durata una decina di minuti.
Nella terza e ultima fase, ai partecipanti sono stati proiettati 96 video di attori, della durata di poco più di dieci secondi ciascuno, che raccontavano apparentemente intense esperienze emotive. Ai partecipanti è stato quindi chiesto di valutare l’emozione e l’intensità rappresentate nei video, nonché i propri sentimenti corrispondenti. Questa fase è durata circa 15 minuti.
Metodo
Per arrivare alla media media dei volti catturati (vedi prima immagine, sopra), i punti di riferimento emotivi sono stati catturati con il framework EmoNet . Successivamente è stata determinata la corrispondenza tra la forma del viso e la forma del viso media (media) attraverso una trasformazione affine a tratti .
Il riconoscimento dimensionale delle emozioni e la previsione dello sguardo è stato effettuato su ciascun segmento di riferimento identificato nella fase precedente.
A questo punto, l’inferenza emotiva basata sull’audio ha indicato che un momento insegnabile è arrivato nello stato mentale del paziente e il compito è catturare l’immagine facciale corrispondente e sviluppare quella dimensione e dominio del suo stato affettivo.
Analisi automatica delle emozioni da volti in natura
(Nel video sopra, vediamo il lavoro sviluppato dagli autori delle tecnologie di riconoscimento delle emozioni dimensionali utilizzate dai ricercatori per il nuovo lavoro).
La forma geodetica del materiale è stata calcolata per ogni frame dei dati e la riduzione della Singular Value Decomposition ( SVD ) è stata applicata. I dati delle serie temporali risultanti sono stati infine modellati come un processo VAR e quindi ulteriormente ridotti tramite SVD prima dell’adattamento MAP .
Flusso di lavoro per il processo di riduzione geodetica.
Anche i valori di valenza e eccitazione nella rete EmoNet sono stati elaborati in modo simile con la modellazione VAR e il calcolo del kernel di sequenza.
Esperimenti
Come spiegato in precedenza, il nuovo lavoro è principalmente un documento di ricerca medica piuttosto che una presentazione standard di visione artificiale e rimandiamo il lettore al documento stesso per una copertura approfondita dei diversi esperimenti OEG condotti dai ricercatori.
Tuttavia, per riassumerne una selezione:
Segnali di disturbo affettivo
Qui è stato chiesto a 40 partecipanti (non dal gruppo di controllo o di pazienti) di valutare le facce medie valutate (vedi sopra) rispetto a una serie di domande, senza essere informati del contesto dei dati. Le domande erano:
Qual è il sesso delle due facce?
I volti hanno un aspetto attraente?
Questi volti sono persone affidabili?
Come valuta la capacità di agire di queste persone?
Qual è l’emozione dei due volti?
Qual è l’aspetto della pelle dei due volti?
Qual è l’impressione dello sguardo?
Le due facce hanno gli angoli della bocca cadenti?
Le due facce hanno gli occhi marroni in rilievo?
Queste persone sono pazienti clinici?
I ricercatori hanno scoperto che queste valutazioni alla cieca erano correlate allo stato registrato dei dati elaborati:
Risultati del box plot per il sondaggio “faccia media”.
Valutazione clinica
Per valutare l’utilità dell’OEG nella valutazione iniziale, i ricercatori hanno prima valutato quanto sia efficace la valutazione clinica standard di per sé, misurando i livelli di miglioramento tra l’induzione e la seconda fase (a quel punto il paziente riceve tipicamente trattamenti a base di farmaci.
I ricercatori hanno concluso che lo stato e la gravità dei sintomi potrebbero essere ben valutati con questo metodo, ottenendo una correlazione di 0,82. Tuttavia, una diagnosi accurata di schizofrenia o depressione si è rivelata più difficile, con il metodo standard che ha ottenuto solo un punteggio di -0,03 in questa fase iniziale.
Gli autori commentano:
‘In sostanza, lo stato del paziente può essere determinato relativamente bene utilizzando i consueti questionari. Tuttavia, questo è essenzialmente tutto ciò che se ne può concludere. Non è indicato se qualcuno è depresso o piuttosto schizofrenico. Lo stesso vale per la risposta al trattamento.’
I risultati del processo macchina sono stati in grado di ottenere punteggi più alti in questa area problematica e punteggi comparabili per l’aspetto iniziale della valutazione del paziente:
Numeri più alti sono migliori. A sinistra, i risultati dell’accuratezza della valutazione basata su interviste standard in quattro fasi dell’architettura di test; a destra, risultati basati sulla macchina.
Diagnosi del disturbo
Distinguere la depressione dalla schizofrenia attraverso immagini statiche del viso non è cosa da poco . Con convalida incrociata, il processo macchina è stato in grado di ottenere punteggi di accuratezza elevati nelle varie fasi delle prove:
In altri esperimenti, i ricercatori sono stati in grado di dimostrare l’evidenza che l’OEG può percepire il miglioramento del paziente attraverso il trattamento farmacologico e il trattamento generale del disturbo:
‘L’inferenza causale sulla conoscenza empirica a priori della raccolta dei dati ha adattato il trattamento farmacologico al fine di osservare un ritorno alla regolazione fisiologica della dinamica facciale. Tale ritorno non poteva essere osservato durante la prescrizione clinica.
‘Al momento non è chiaro se una tale raccomandazione basata su una macchina risulterebbe effettivamente in un successo significativamente migliore della terapia. Soprattutto perché è noto quali effetti collaterali possono avere i farmaci per un lungo periodo di tempo.
“Tuttavia, [questo tipo] di approcci su misura per il paziente infrangerebbero le barriere dello schema di classificazione categoriale comune ancora prevalentemente utilizzato nella vita quotidiana”.
Martin Aderson da Unite.ai