ElevenLabs lancia Scribe: un modello di trascrizione vocale per competere con Otter, TurboScribe e altri
ElevenLabs, nota per le sue tecnologie di sintesi vocale e generazione di voci AI, ha annunciato il lancio di Scribe, un nuovo strumento di trascrizione da voce a testo che…
OctoTools: framework open-source di Stanford che ottimizza il ragionamento degli LLM attraverso l’orchestrazione modulare degli strumenti
Un team di scienziati dell’Università di Stanford ha presentato OctoTools, una nuova piattaforma open-source progettata per potenziare le capacità dei Large Language Models (LLM) nei compiti di ragionamento complessi. OctoTools…
Polycam innova la scansione 3D su iPhone: cattura ambienti in pochi secondi e genera planimetrie PDF automaticamente
Polycam, leader nella tecnologia di cattura 3D fotorealistica tramite app per iPhone e iPad, ha annunciato Vision 25, un aggiornamento significativo che migliora le capacità di scansione 3D, documentazione e…
Hugging Face lancia FastRTC: semplificare lo sviluppo di applicazioni AI in tempo reale per voce e video
Hugging Face, startup nel campo dell’intelligenza artificiale valutata oltre 4 miliardi di dollari, ha annunciato il lancio di FastRTC, una libreria Python open-source progettata per facilitare lo sviluppo di applicazioni…