aiOla, startup specializzata in intelligenza artificiale applicata all’audio, ha introdotto una soluzione innovativa: Whisper-NER. Questo modello open source combina il riconoscimento automatico del parlato (ASR) con il riconoscimento di entità nominate (NER) per trascrivere l’audio oscurando simultaneamente dati sensibili come nomi, numeri di telefono e indirizzi.
Whisper-NER si basa su Whisper, il modello open source di OpenAI, e integra funzionalità avanzate di NER per identificare e mascherare automaticamente informazioni sensibili durante il processo di trascrizione. Questa integrazione elimina la necessità di utilizzare strumenti separati per ASR e NER, riducendo il rischio di esposizione dei dati durante le fasi intermedie di elaborazione.
Gill Hetz, Vicepresidente della Ricerca presso aiOla, ha dichiarato: “Abbiamo progettato questo strumento open source per avanzare la privacy nell’IA. Aiuta gli utenti a mascherare i dati sensibili senza la necessità di passaggi software aggiuntivi.”
Whisper-NER è disponibile gratuitamente su piattaforme come Hugging Face e GitHub, consentendo a organizzazioni e individui di utilizzare, adattare e distribuire il modello secondo le proprie esigenze. Una demo è disponibile su Hugging Face, permettendo agli utenti di registrare frammenti di parlato e specificare le parole da mascherare nella trascrizione risultante. Durante un test, il modello ha mascherato con successo la parola “VentureBeat”, dimostrando la sua efficacia nel riconoscere e oscurare termini specifici.
L’adozione di Whisper-NER rappresenta un passo significativo verso la protezione della privacy nelle trascrizioni audio. Automatizzando l’oscuramento delle informazioni sensibili, il modello aiuta le aziende a conformarsi alle normative sulla protezione dei dati, riducendo al contempo il rischio di violazioni. La disponibilità del modello come open source favorisce la trasparenza e la collaborazione nella comunità tecnologica, promuovendo lo sviluppo di soluzioni sempre più efficaci per la tutela della privacy.