Una nuova ricerca in Cina offre un nuovo metodo per il Natural Language Processing (NLP) per eseguire analisi del sentiment sui forum dei social media e sui set di dati di ricerca linguistica, classificando ed etichettando GIF animate che vengono pubblicate in risposta ad annunci di testo.

I ricercatori, guidati da Boaz Shmueli della National Tsing Hua University di Taiwan, hanno utilizzato il database integrato di Twitter di GIF di reazione come indice per quantificare lo stato affettivo della risposta di un utente, ovviando alla necessità di negoziare risposte in più lingue, la sfida di rilevare il sarcasmo o identificare la temperatura emotiva centrale da risposte ambigue o eccessivamente brevi.

Fare clic sul pulsante “GIF” durante la composizione di un post su Twitter offre un set standard di GIF animate etichettate che sono potenzialmente più facili per la PNL analizzare le emozioni “identificate” rispetto al linguaggio di testo normale.
Il documento caratterizza l’uso delle GIF di reazione in questo modo come “ un nuovo tipo di etichetta, non ancora disponibile nei set di dati sulle emozioni della PNL ” e osserva che i set di dati esistenti utilizzano il modello dimensionale dell’emozione o il modello delle emozioni discrete , nessuno dei quali offre questo tipo di intuizione.

I ricercatori hanno rilasciato un set di dati di 30.000 tweet sarcastici contenenti reazioni GIF. Questo approccio offre alla PNL una distinzione assente da altra letteratura corrente: un metodo per distinguere l’ emozione percepita (emozioni che un lettore identifica dal testo) dall’emozione indotta (una sensazione che il lettore sperimenta come reazione al testo).

GIF di reazione come indicatori riduttivi
In termini di risposta di supporto a un post che condivide uno stato emotivo angosciante, un’apposita GIF è utilmente riduzionista e di intenti inequivocabili, quando pubblicata senza testo di supporto (e questi sono i tipi di risposta GIF su cui lo studio si è concentrato).

Ad esempio, reazioni come “È brutale, amico” , “È un peccato” o “Awww” contengono potenziali ambiguità di intenti, dalla possibilità di un certo punto di vista “clinico” e inalterato fino alla possibilità del sarcasmo; ma la pubblicazione di una delle centinaia di GIF della categoria “ abbraccio ” di Twitter lascia meno spazio all’interpretazione:

Tuttavia, all’interno di ogni singola categoria di reazione, come “ abbraccio ”, ci sono numerosi indicatori aggiuntivi dell’umore o del punto di vista che comprendono più generi di stato affetto, incluso il punto di vista dei presupposti romantici o familiari di relazione tra il rispondente e il poster originale.

Rappresentazione di vari tipi di relazione nella categoria GIF “abbraccio” di Twitter. L’uso di diversi generi, tropi, rappresentazioni di genere e altri fattori aggiunge granularità alla potenziale interpretabilità di una scelta GIF per questo sentimento.
Il set di dati ReactionGIF è stato derivato dalle prime 100 GIF in ogni categoria di reazione disponibile su Twitter, portando a un database di 4300 immagini animate. Quando una GIF viene visualizzata in più di una categoria, la categoria con il posizionamento più alto nella GUI ha un peso maggiore. Alle immagini che compaiono in più categorie viene assegnato un fattore di somiglianza di reazione , una metrica inventata per lo studio.

Le affinità vengono quindi scoperte utilizzando il clustering gerarchico e il collegamento medio.


Il set di dati è stato generato ed etichettato applicando il metodo contro 30.000 tweet. Il ‘ricco segnale affettivo’ di una categoria di reazione ha permesso ai ricercatori di aumentare il set di dati con ulteriori etichette affettive, basate sui cluster di categorie di reazioni positive e negative, e di aggiungere etichette di emozioni con uno schema di mappatura dedicato alle reazioni alle emozioni, basato su il verdetto della maggioranza di tre valutatori umani su tweet campione.

Il lavoro precedente di Yahoo e The University Of Rochester, che si occupa dell’annotazione di GIF, non ha questo strato di testo suscitato, né alcuna categoria di reazione, ma è puramente semantico.

I ricercatori hanno valutato il set di dati attraverso quattro approcci: RoBERTa , Convolutional Neural Network (CNN) GloVe , un classificatore di regressione logistica e un classificatore di classi a maggioranza semplice. Il peso della convinzione per ciascuna categoria emerge abbastanza chiaramente nei risultati, con l’approvazione, l’accordo e la commiserazione più facili da identificare (e più rappresentati) e le scuse più difficili da valutare, forse poiché questo include la possibilità del sarcasmo.

 

Il modello RoBERTa ha generato la media della classifica testata più alta tra tutti e tre i metodi di valutazione, che comprendevano la previsione della reazione affettiva, la previsione del sentimento indotto e la previsione dell’emozione indotta.

Raccogliere l’emozione dell’utente dalle GIF di reazione
I ricercatori osservano che l’identificazione delle emozioni indotte è uno dei compiti più impegnativi nell’analisi dei sentimenti e delle emozioni basata sulla PNL e che l’uso di GIF di reazione come proxy offre la possibilità per i progetti successivi di raccogliere “ grandi quantità di -etichette affettive di qualità ‘ .

Nonostante si concentri su un luogo molto specifico di GIF incorporate nell’esperienza utente di Twitter, lo studio sostiene che questo metodo può essere generalizzato ad altre piattaforme di social media, nonché piattaforme di messaggistica istantanea, e potenzialmente essere utile in settori come il riconoscimento delle emozioni e il multimodale rilevamento delle emozioni.

Popolarità come indice chiave
L’approccio sembra fare affidamento su una certa “viralità” per ogni GIF, come quando una GIF viene effettivamente resa disponibile tramite i meccanismi propri di Twitter. Presumibilmente, le nuove GIF generate dagli utenti non potrebbero entrare in questa ecostruttura se non attraverso una maggiore popolarità e adozione come meme.

Le GIF di reazione hanno rianimato l’uso del primitivo formato GIF animato del 1987 negli ultimi dieci anni, dopo anni di discredito come divoratore di larghezza di banda (utilizzato principalmente per fastidiosi banner pubblicitari) nell’era pre-banda larga di Internet V1.

 

Di ihal