Recentemente, il mercato dell’intelligenza artificiale è stato scosso dall’annuncio di Manus AI, un agente AI cinese che ha suscitato sia entusiasmo che scetticismo. Presentato come il “secondo DeepSeek”, Manus AI ha attirato l’attenzione per le sue presunte capacità avanzate, ma le valutazioni iniziali suggeriscono che potrebbe non essere all’altezza delle aspettative.​

La scorsa settimana, Manus AI ha dichiarato di aver sviluppato un agente AI in grado di superare il “Deep Research” di OpenAI. Sono stati mostrati video dimostrativi in cui l’agente eseguiva compiti come la creazione di siti web personalizzati, la pianificazione di viaggi e l’analisi approfondita di dati. Inoltre, Manus AI ha affermato di aver superato Deep Research nel benchmark GAIA, alimentando l’entusiasmo e portando alcuni a definirlo il “secondo DeepSeek”.​

In Cina, Manus AI è stato accolto con entusiasmo, con i media locali che lo hanno descritto come un motivo di orgoglio nazionale. Sui social media, influencer e utenti hanno condiviso informazioni esaltanti sulle sue capacità. Tuttavia, al di fuori della Cina, le reazioni sono state più caute. Alcuni utenti hanno riferito che, durante i test, Manus AI ha mostrato errori, cicli infiniti e prestazioni inferiori alle aspettative. Alexander Doria, co-fondatore della startup AI Playas, ha osservato che Manus AI sembra combinare modelli AI esistenti, come “Claude 3.7 Sonnet” di Anthropic e “Qwen” di Alibaba, piuttosto che introdurre innovazioni proprie.​

Diversi tester hanno segnalato che Manus AI commette errori nelle verifiche dei fatti, fornisce fonti incoerenti e omette informazioni facilmente reperibili online. In compiti comuni come ordinare in fast food, prenotare voli o ristoranti e sviluppare giochi di combattimento, l’agente ha spesso fallito. Nonostante le affermazioni iniziali, sembra che Manus AI non abbia sviluppato un proprio modello AI e non abbia ancora reso pubbliche le sue tecnologie.

Di Fantasy