Immagine AI

Un gruppo di ricerca dell’Università degli Studi di Cassino e del Lazio Meridionale ha sviluppato un modello di intelligenza artificiale per la classificazione automatica delle lesioni cutanee a partire da immagini dermoscopiche. Il lavoro, firmato da Taofik Ahmed Suleiman, Daniel Tweneboah Anyimadu, Andrew Dwi Permana, Hsham Abdalgny Abdalwhab Ngim e Alessandra Scotto di Freca, è stato realizzato nell’ambito delle attività di ricerca dell’ateneo dedicate all’analisi delle immagini mediche e ai sistemi di supporto alla diagnosi.

Il sistema non è progettato per sostituire il dermatologo né per formulare una diagnosi clinica autonoma. Il suo obiettivo è classificare immagini di lesioni cutanee in tre categorie: lesioni benigne, melanoma e cheratosi seborroica. Si tratta quindi di un modello di computer-aided diagnosis, cioè di supporto computazionale all’interpretazione delle immagini, pensato per ridurre il carico di analisi iniziale e rendere più strutturata la gestione di grandi quantità di immagini dermoscopiche.

La ricerca affronta uno dei limiti più frequenti nei dataset dermatologici: la forte sproporzione tra le classi disponibili. Il dataset ISIC 2017 utilizzato nello studio comprende 2.000 immagini JPEG, di cui 1.372 relative a lesioni benigne, 374 a melanomi e 254 a cheratosi seborroiche. In una base dati di questo tipo, un modello tradizionale rischia di apprendere soprattutto la classe più rappresentata, classificando molte immagini come benigne e ottenendo un’apparente buona accuratezza generale, ma con risultati meno affidabili proprio sulle lesioni più critiche.

Per affrontare il problema, il gruppo di Cassino ha adottato un’architettura gerarchica a due stadi. Nella prima fase il sistema distingue le lesioni benigne dall’insieme delle lesioni non benigne, composto da melanoma e cheratosi seborroica. Nella seconda fase analizza soltanto le immagini considerate non benigne, separando i casi di melanoma da quelli di cheratosi seborroica. Questa struttura evita di affrontare direttamente una classificazione a tre classi fortemente sbilanciata e trasforma il problema in due decisioni binarie successive, più controllabili dal punto di vista statistico.

Il riequilibrio dei dati è stato applicato già nella preparazione del primo stadio. Le immagini di melanoma e cheratosi seborroica sono state aggregate nella categoria “altre” e portate a 1.000 campioni tramite ricampionamento, mentre la classe delle lesioni benigne è stata ridotta a 1.000 immagini. In questo modo il modello ha potuto essere addestrato su una prima decisione tra due classi numericamente equivalenti, limitando l’effetto della prevalenza delle immagini benigne.

Sul piano algoritmico, il sistema utilizza DenseNet121 come estrattore di caratteristiche visive. DenseNet121 è una rete neurale convoluzionale pre-addestrata su ImageNet, scelta per la sua capacità di riutilizzare le informazioni prodotte nei livelli precedenti della rete e per l’efficienza nel trattamento di immagini complesse. Le immagini dermoscopiche non vengono quindi classificate direttamente dall’ultimo livello della rete neurale: DenseNet121 genera invece vettori di caratteristiche che descrivono pattern cromatici, strutture, bordi, texture e distribuzioni visive della lesione.

Queste caratteristiche vengono poi standardizzate e ridotte dimensionalmente con la PCA, mantenendo 50 componenti nel primo stadio e 70 nel secondo. Il classificatore finale è un random forest composto da 50 alberi decisionali per ciascuna fase. L’approccio combina quindi deep learning e machine learning tradizionale: la rete neurale estrae informazioni visive ad alto livello, mentre il random forest gestisce la decisione finale sulle caratteristiche prodotte dalla rete.

Lo studio ha confrontato DenseNet121 con una CNN personalizzata, VGG16 e ResNet50, oltre a diversi classificatori tradizionali, tra cui support vector machine, k-nearest neighbors e regressione logistica. La configurazione DenseNet121 più random forest ha ottenuto i risultati migliori. Nel test finale ha raggiunto un’accuratezza dell’85,67% nella distinzione tra lesioni benigne e non benigne e del 94,68% nella successiva separazione tra melanoma e cheratosi seborroica.

Il dato più significativo è l’accuratezza multiclass bilanciata, una metrica che considera separatamente le prestazioni sulle diverse classi e non lascia che la categoria numericamente più ampia condizioni il risultato complessivo. Il modello ibrido DenseNet121 più random forest ha ottenuto una balanced multiclass accuracy del 91,07%, superiore all’88,66% registrato dalla versione basata soltanto sulla rete neurale DenseNet121.

Il sistema evita inoltre una fase separata di segmentazione della lesione, cioè non richiede una maschera manuale o automatica che delimiti preventivamente l’area cutanea da analizzare. Questa scelta riduce la complessità della pipeline e limita la dipendenza dalla qualità della segmentazione, un passaggio che può introdurre errori aggiuntivi quando l’immagine contiene peli, riflessi, variazioni di illuminazione o margini poco definiti.

I risultati restano legati al dataset pubblico ISIC 2017 e a un contesto sperimentale supervisionato. Il modello rappresenta quindi una base tecnica per sistemi di supporto alla valutazione dermatologica, non uno strumento diagnostico già utilizzabile in autonomia su pazienti. La validazione su immagini raccolte in centri clinici diversi, con dispositivi differenti e su popolazioni più ampie, sarà necessaria per verificare robustezza, generalizzabilità e applicabilità in un percorso sanitario reale.

Il valore del progetto sviluppato a Cassino risiede soprattutto nell’architettura adottata: invece di affidare l’intera classificazione a una singola rete neurale addestrata su dati limitati e sbilanciati, il sistema suddivide il problema in passaggi distinti e combina trasferimento di apprendimento, riduzione dimensionale e classificazione a foresta casuale. È un approccio pensato per ottenere risultati più stabili quando le immagini disponibili non sono sufficienti per addestrare da zero modelli profondi di grandi dimensioni.

Di Fantasy