Recentemente, si è sollevato un allarme riguardo alla possibilità di creare immagini dannose attraverso l’elusione delle misure di sicurezza di “Midjourney”, un’intelligenza artificiale generatrice di immagini. In un momento in cui si stanno preparando le contromisure per sfidare il diffondersi di contenuti falsi, come la creazione di notizie ingannevoli da parte di “Chat GPT”, le preoccupazioni si concentrano sulle possibili future tattiche di aggiramento.
Il sito Bloomberg ha riportato che il Center for Digital Hate Response (CCDH), un’organizzazione no-profit, ha condotto uno studio rivelatore. I risultati di tale studio hanno evidenziato come sia sorprendentemente semplice eludere le barriere di sicurezza di Midjourney e creare immagini con intenti dannosi.
Midjourney, iniziativa che sovrintende alla generazione di immagini seguendo precise linee guida, mira a prevenire la creazione di contenuti impropri, distorti o dannosi. Le condizioni d’uso vietano la creazione di contenuti volgari, offensivi o per adulti, nonché immagini di natura sanguinolenta. Inoltre, impediscono l’uso della piattaforma per la creazione di immagini a fini politici.
La piattaforma è in grado di bloccare automaticamente alcune forme di input e conta su 68 moderatori per vigilare sul contenuto generato dagli utenti.
Tuttavia, secondo quanto emerso da un rapporto del CCDH, gli utenti riescono comunque a creare immagini odiose o ingannevoli, eludendo queste precauzioni.
I ricercatori hanno effettuato un confronto tra immagini associate alla teoria del complotto “Pizzagate”, una falsa affermazione secondo cui Hillary Clinton e John Podesta avrebbero gestito un traffico di bambini in una pizzeria di Washington, DC, e “volti malevoli di politici con sorrisi tristi”. Questi confronti hanno dimostrato quanto sia facile creare tali immagini utilizzando suggerimenti come “bambini” e “pizzeria”.
La ricerca ha anche evidenziato che alcune parole chiave possono essere sfruttate. Ad esempio, sebbene non fosse possibile creare un’immagine di sangue sulla mano, è stato invece possibile realizzarne una simile usando la frase “sciroppo di fragole”.
Midjourney è attualmente uno dei generatori di immagini AI più popolari, vantando oltre 42 milioni di visitatori mensili secondo il suo sito web. Accessibile esclusivamente tramite l’app di messaggistica Discord, richiede un abbonamento a partire da $ 10 al mese. Con 14 milioni di utenti registrati nel server Discord, gli abbonati possono richiedere immagini attraverso l’invio di un messaggio al bot Midjourney.
I ricercatori hanno sottolineato che le piattaforme più popolari sono spesso quelle che diffondono più disinformazione.
“Qualsiasi individuo può sfruttare questi strumenti per creare contenuti dannosi”, ha affermato Callum Hood, direttore delle ricerche presso CCDH. Ha inoltre evidenziato: “Il problema principale risiede nella creazione di immagini realistiche che ritraggono eventi improbabili”.