Immagine AI

Speechify ha esteso la propria funzione Voice Typing a iPhone e Mac, trasformando l’app in uno strumento di dettatura che può inserire testo direttamente nelle applicazioni già utilizzate dall’utente. La funzione è pensata per lavorare in servizi email, editor di documenti, chat aziendali, browser, moduli web e strumenti di scrittura come Gmail, Google Docs, Slack, Notion, Microsoft Word, iMessage e ChatGPT, senza richiedere un ambiente separato per trascrivere prima la voce e copiare poi il testo.

L’obiettivo tecnico non è soltanto convertire l’audio in parole. Speechify combina il riconoscimento vocale in tempo reale con un livello di post-elaborazione basato su AI che interviene sul testo prodotto durante la dettatura. Il sistema può aggiungere punteggiatura, correggere piccoli errori di trascrizione, rimuovere intercalari come “ehm” e “uh”, rendere più leggibili le frasi spezzate e adattare la formulazione a un linguaggio scritto più naturale. La dettatura viene quindi trattata come una prima bozza parlata che il software trasforma direttamente in testo pronto da inviare o modificare.

Speechify indica una velocità potenziale di circa 160 parole al minuto, contro una media di circa 40 parole al minuto per la digitazione da tastiera. Il confronto non dipende soltanto dalla velocità di riconoscimento, ma dalla possibilità di parlare in modo continuo senza dover fermare la dettatura per inserire ogni segno di punteggiatura o correggere manualmente molte imprecisioni. Il modello deve infatti riconoscere il parlato, segmentare correttamente le frasi, distinguere le pause significative dalle esitazioni e produrre una versione testuale coerente con il contesto.

Su macOS, Voice Typing funziona come livello di input trasversale alle applicazioni desktop. L’utente può attivare la dettatura e inserire il testo nel campo in cui si trova il cursore, senza che l’app destinataria debba integrare una funzione di riconoscimento vocale proprietaria. Questo consente di usare lo stesso flusso in un client di posta, in una conversazione Slack, in un documento Word, in una finestra del browser o in un sistema gestionale accessibile via web.

Su iOS, l’estensione della funzione punta invece a rendere la voce un’alternativa pratica alla tastiera virtuale. In questo scenario, il valore non è soltanto scrivere messaggi più rapidamente, ma poter comporre email, note, richieste di assistenza, prompt per strumenti AI e testi più lunghi senza passare continuamente tra tastiera, microfono e funzioni di modifica. Speechify presenta il rilascio come una funzione inclusa senza limiti di utilizzo, mentre molti concorrenti applicano soglie mensili, crediti o piani a pagamento per le trascrizioni vocali.

La funzione si inserisce nell’evoluzione di Speechify da piattaforma text-to-speech a sistema di produttività vocale più ampio. Oltre alla lettura ad alta voce di documenti, PDF, email e pagine web, il servizio ha aggiunto strumenti di chat vocale, note AI, generazione di podcast, trascrizione e assistenza alla scrittura. Voice Typing completa questo passaggio consentendo di usare la voce non solo per consumare contenuti o interrogare un assistente, ma anche per produrre testo operativo all’interno delle applicazioni quotidiane.

Dal punto di vista dell’architettura del prodotto, il punto centrale è la separazione tra applicazione in cui il testo viene scritto e motore che produce quel testo. Speechify non richiede che Google Docs, Slack, Word o Gmail implementino una propria integrazione con il modello: il software agisce come livello di dettatura e revisione che si appoggia ai normali campi di input del sistema operativo. Questo rende l’esperienza più vicina a una tastiera vocale intelligente che a un semplice registratore con trascrizione.

Il rilascio su iPhone e Mac rende quindi disponibile un workflow unico tra dispositivi mobili e desktop: l’utente può iniziare a dettare un’idea sul telefono, usare la stessa logica di correzione automatica sul Mac e continuare a produrre testo in applicazioni diverse senza cambiare strumento. La componente AI interviene soprattutto nella fase che normalmente rallenta la dettatura tradizionale, cioè la pulizia del testo finale, riducendo la quantità di correzioni necessarie prima dell’invio o della pubblicazione.

Di Fantasy