La società cinese di intelligenza artificiale SenseTime ha recentemente presentato SenseNova 5.5 durante la World Artificial Intelligence Conference 2024. Questa nuova versione include il primo modello multimodale in tempo reale della Cina, chiamato SenseNova 5o, che offre capacità di interazione in streaming simili a GPT-4o di OpenAI.
SenseNova 5.5 rappresenta un miglioramento del 30% rispetto alla versione precedente, SenseNova 5.0, lanciata solo due mesi fa. I principali miglioramenti includono una migliore capacità di ragionamento matematico, una maggiore competenza in inglese e abilità avanzate nei comandi, mettendolo alla pari con GPT-4o in termini di interattività e prestazioni.
Il dottor Xu Li, CEO di SenseTime, ha sottolineato l’importanza di questa evoluzione, affermando che il 2024 è un anno critico per i modelli di grandi dimensioni che stanno passando da unimodale a multimodale. SenseTime ha anche introdotto un modello edge-side a basso costo, riducendo il prezzo per dispositivo a partire da 9,90 RMB all’anno, per favorire la diffusione su vari dispositivi IoT come smartphone, tablet e computer di bordo nei veicoli.
L’azienda ha lanciato Vimi, un generatore di video avatar AI che crea brevi clip video con controllo preciso sulle espressioni facciali e sui movimenti del corpo da una singola foto. Inoltre, SenseTime ha migliorato il suo strumento di codifica Code Raccoon, aumentando la precisione e la velocità di risposta.
Per attrarre nuovi utenti aziendali, SenseTime ha introdotto il programma “Project $0 Go”, offrendo un pacchetto di onboarding gratuito per le aziende che migrano dalla piattaforma OpenAI.
SenseNova Large è già utilizzato da oltre 3.000 clienti governativi e aziendali in settori come tecnologia, sanità, finanza e programmazione. SenseTime continua a sviluppare applicazioni AI per aumentare la produttività e l’efficienza dei costi in settori come agricoltura, turismo culturale e sanità.