Lo studio rileva che i maschi sono rappresentati quattro volte di più rispetto alle femmine in letteratura
Uno strumento di intelligenza artificiale trova trova una discrepanza sbalorditiva nella rappresentazione femminile in letteratura
I ricercatori della USC Viterbi School of Engineering hanno utilizzato le tecnologie di intelligenza artificiale per concludere che i personaggi maschili sono quattro volte più diffusi nella letteratura rispetto ai personaggi femminili.
Mayank Kejriwal, un capo della ricerca presso l’Information Sciences Institute (ISI) della USC, è stato ispirato dal lavoro attuale sui pregiudizi di genere impliciti e dalla sua stessa esperienza nell’elaborazione del linguaggio naturale (PNL). Mentre molti studi pubblicati esaminano e analizzano gli aspetti qualitativi della rappresentazione femminile nella letteratura e nei media, la ricerca di Kejriwal ha sfruttato in particolare i suoi punti di forza: la raccolta di dati quantitativi attraverso gli algoritmi di apprendimento automatico esistenti.
Per produrre questi risultati, Kejriwal e Nagaraj hanno avuto accesso ai dati attraverso il corpus del progetto Gutenberg che contiene 3.000 libri in lingua inglese, un ulteriore tentativo di mitigare i pregiudizi dei ricercatori. Il genere dei libri variava dall’avventura e dalla fantascienza, al mistero e al romanticismo e in vari mezzi, inclusi romanzi, racconti e poesie.
Akarsh Nagaraj, MS ’21, coautore dello studio e Machine Learning Engineer presso Meta, ha contribuito a scoprire lo squilibrio letterario 4:1 uomo-donna.
“Il pregiudizio di genere è molto reale e quando vediamo femmine quattro volte meno in letteratura, ha un impatto subliminale sulle persone che consumano la cultura”, ha affermato Kejriwal, assistente professore di ricerca presso il Dipartimento di ingegneria industriale e dei sistemi di Daniel J Epstein. “Abbiamo rivelato quantitativamente in modo indiretto in che il pregiudizio persiste nella cultura”.
Nagaraj ha notato l’importanza di come i loro metodi e i risultati dello studio abbiano impartito loro una maggiore comprensione dei pregiudizi nella società e delle sue implicazioni. “I libri sono una finestra sul passato e la scrittura di questi autori ci dà uno sguardo su come le persone percepiscono il mondo e su come è cambiato”.
Uomini ovunque… e personaggi principali
Lo studio delinea diversi metodi per definire la prevalenza femminile in letteratura. Hanno utilizzato Named Entity Recognition (NER), un importante metodo NLP utilizzato per estrarre caratteri specifici del genere. “Uno dei modi in cui lo definiamo è guardare quanti pronomi femminili ci sono in un libro rispetto ai pronomi maschili”, ha detto Kejriwal. L’altra tecnica consiste nel quantificare quanti personaggi femminili sono i personaggi principali in esso.
Ciò ha permesso al team di ricerca di determinare se i personaggi maschili fossero al centro della storia.
I risultati dello studio hanno anche mostrato che la discrepanza tra i personaggi maschili e femminili diminuisce sotto la paternità femminile. “Ci ha mostrato chiaramente che le donne in quei tempi si sarebbero rappresentate molto più di quanto farebbe uno scrittore maschio”, ha detto Nagaraj.
I metodi diversificati del team per misurare e determinare la rappresentazione femminile in letteratura non sono stati privi di limitazioni, tuttavia, quando gli autori non sono né uomini né donne. “Quando abbiamo pubblicato il documento del set di dati, i revisori hanno espresso questa critica sul fatto che stavamo ignorando i generi non dicotomici”, ha affermato Kejriwal. “Ma eravamo d’accordo con loro, in un certo senso. Pensiamo che sia completamente soppresso e non saremo in grado di trovarne molti [individui transgender o individui non dicotomici]”.
Dicotomie impegnative
Kejriwal ha riconosciuto che gli strumenti di intelligenza artificiale per identificare le parole plurali, come “loro”, che potrebbero riferirsi a un individuo non dicotomico, non esistono ancora. Tuttavia, i risultati dello studio creano il quadro per affrontare tali problemi sociali e costruire le tecnologie in grado di affrontare questi deficit.
Lo studio fornisce anche un modello per il lavoro futuro sulla quantificazione dei risultati qualitativi che hanno scoperto attraverso le metodologie dello studio. Senza il pregiudizio intrinseco dei sondaggi progettati dall’uomo, la tecnologia NLP ha anche consentito loro di trovare associazioni di aggettivi con caratteri specifici del genere, approfondendo la loro comprensione del pregiudizio e della sua pervasività nella società.
“Anche con attribuzioni errate, le parole associate alle donne erano aggettivi come ‘debole’, ‘amabile’, ‘carino’ e talvolta ‘stupido'”, ha detto Nagaraj. “Per i personaggi maschili, le parole che li descrivevano includevano ‘leadership’, ‘potere’, ‘forza’ e ‘politica’”.
Sebbene il team alla fine non abbia quantificato questo aspetto del loro studio, questa differenza nelle descrizioni qualitative tra i caratteri specifici del genere offre una prospettiva futura per un’indagine qualitativa più completa sulle associazioni di parole con il genere.
“Il nostro studio ci mostra che il mondo reale è complesso, ma ci sono vantaggi per tutti i diversi gruppi della nostra società che partecipano al discorso culturale”, ha affermato Kejriwal. “Quando lo facciamo, tende ad avere una visione più realistica della società”.
Kejriwal spera che lo studio serva a evidenziare l’importanza della ricerca interdisciplinare, ovvero l’utilizzo della tecnologia di intelligenza artificiale per evidenziare questioni sociali urgenti e disuguaglianze che possono essere affrontate. Le parti interessate con un background specializzato, compresi gli informatici, possono offrire strumenti per elaborare i dati e rispondere alle domande e i responsabili politici possono utilizzare questi dati per attuare il cambiamento.