Twelve Labs, azienda specializzata nell’intelligenza artificiale applicata all’analisi video, ha recentemente annunciato il rilascio di Pegasus 1.2, un aggiornamento significativo del suo modello di linguaggio video. Questa versione mira a migliorare la comprensione contestuale dei video, rispondendo alle esigenze specifiche dei settori industriali.

L’aggiornamento si concentra su due aree principali:

  • Analisi Sincronizzata di Audio e Video: Pegasus 1.2 è stato ottimizzato per analizzare simultaneamente dati visivi e sonori, consentendo una comprensione più profonda di scene complesse. Ad esempio, in una sequenza cinematografica, il modello è ora in grado di distinguere tra dialoghi, effetti sonori e musica di sottofondo, migliorando l’accuratezza dell’interpretazione.
  • Espansione della Lunghezza Contestuale: Il modello è stato potenziato per gestire video di durata superiore, fino a un’ora, senza compromettere la precisione. Questo è particolarmente utile per l’analisi di film completi, episodi televisivi o lunghe registrazioni di sorveglianza.

Grazie a queste migliorie, Pegasus 1.2 trova applicazione in diversi settori:

  • Intrattenimento: Sintesi di lungometraggi e episodi televisivi, creazione di riassunti e highlight.
  • Educazione: Sintesi di lezioni e corsi online, estrazione dei punti chiave per facilitare l’apprendimento.
  • Sicurezza: Analisi di registrazioni CCTV per rilevare anomalie o eventi significativi.

A differenza di altri modelli AI video che aumentano le dimensioni per migliorare le prestazioni, Pegasus 1.2 ottimizza l’efficienza attraverso strategie avanzate di codifica visiva e riduzione dei token. Questo approccio consente di ottenere risultati superiori con un modello relativamente più compatto.

Di Fantasy