Argmax ha lanciato WhisperKit, un software che abilita il modello di riconoscimento vocale Whisper di OpenAI su Apple Watch. Questa integrazione sfrutta il framework CoreML di Apple, permettendo l’utilizzo di Whisper su altri dispositivi Apple compatibili con tale framework.

WhisperKit semplifica l’implementazione del riconoscimento vocale nelle applicazioni WatchOS, utilizzando l’Apple Neural Engine per elaborare i dati vocali in tempo reale. Con una licenza MIT, WhisperKit è progettato per macOS 14.0 o versioni successive e Xcode 15.0 o versioni successive.

Gli sviluppatori possono integrare WhisperKit nei loro progetti Xcode, offrendo varietà nei formati audio e nella selezione del modello. Un utente ha già integrato WhisperKit con le cuffie Vision Pro per trascrivere la sua voce.

Argmax Inc., fondata nel 2020, si specializza in elaborazione del linguaggio naturale, sistemi di raccomandazione e visione artificiale. WhisperKit è un progetto open source, incoraggiando i contributi degli sviluppatori per migliorare funzionalità e adattabilità.

Il rilascio di WhisperKit mira ad espandere l’accesso alla tecnologia di riconoscimento vocale nell’ecosistema Apple, semplificandone l’integrazione nelle applicazioni.

Recenti sviluppi hanno portato all’utilizzo di modelli linguistici di grandi dimensioni su dispositivi come Apple Watch, per l’elaborazione locale di compiti complessi. Questo approccio punta a ridurre la latenza, migliorare la privacy e ottimizzare l’interazione dell’utente.

Dispositivi come Rabbit R1 e Humane Ai Pin si distinguono per l’integrazione dell’intelligenza artificiale in modi unici. Rabbit R1 utilizza un modello per interagire direttamente con le interfacce utente, mentre Humane Ai Pin adotta un sistema operativo basato sull’intelligenza artificiale per un accesso rapido senza parole di attivazione, ponendo l’accento sulla privacy e sull’esperienza utente. Questi dispositivi spostano l’utilizzo dell’intelligenza artificiale su dispositivi più piccoli per un utilizzo più personalizzato ed efficiente della tecnologia.

Di Fantasy