Manus AI tra aspettative elevate e prestazioni deludenti

DiFantasy

Mar 10, 2025

Recentemente, il mercato dell’intelligenza artificiale è stato scosso dall’annuncio di Manus AI, un agente AI cinese che ha suscitato sia entusiasmo che scetticismo. Presentato come il “secondo DeepSeek”, Manus AI ha attirato l’attenzione per le sue presunte capacità avanzate, ma le valutazioni iniziali suggeriscono che potrebbe non essere all’altezza delle aspettative.

La scorsa settimana, Manus AI ha dichiarato di aver sviluppato un agente AI in grado di superare il “Deep Research” di OpenAI. Sono stati mostrati video dimostrativi in cui l’agente eseguiva compiti come la creazione di siti web personalizzati, la pianificazione di viaggi e l’analisi approfondita di dati. Inoltre, Manus AI ha affermato di aver superato Deep Research nel benchmark GAIA, alimentando l’entusiasmo e portando alcuni a definirlo il “secondo DeepSeek”.

In Cina, Manus AI è stato accolto con entusiasmo, con i media locali che lo hanno descritto come un motivo di orgoglio nazionale. Sui social media, influencer e utenti hanno condiviso informazioni esaltanti sulle sue capacità. Tuttavia, al di fuori della Cina, le reazioni sono state più caute. Alcuni utenti hanno riferito che, durante i test, Manus AI ha mostrato errori, cicli infiniti e prestazioni inferiori alle aspettative. Alexander Doria, co-fondatore della startup AI Playas, ha osservato che Manus AI sembra combinare modelli AI esistenti, come “Claude 3.7 Sonnet” di Anthropic e “Qwen” di Alibaba, piuttosto che introdurre innovazioni proprie.

Diversi tester hanno segnalato che Manus AI commette errori nelle verifiche dei fatti, fornisce fonti incoerenti e omette informazioni facilmente reperibili online. In compiti comuni come ordinare in fast food, prenotare voli o ristoranti e sviluppare giochi di combattimento, l’agente ha spesso fallito. Nonostante le affermazioni iniziali, sembra che Manus AI non abbia sviluppato un proprio modello AI e non abbia ancora reso pubbliche le sue tecnologie.

Manus AI tra aspettative elevate e prestazioni deludenti

DiFantasy

Di Fantasy

Articoli correlati

xAI introduce la Quality Mode per Grok per la generazione di immagini e video con maggiore precisione strutturale

Netflix rilascia VOID, l’AI che rimuove oggetti dai video mantenendo la coerenza fisica della scena

Copilot e le clausole “solo per intrattenimento” nei servizi AI di Microsoft

Ultimi Post

xAI introduce la Quality Mode per Grok per la generazione di immagini e video con maggiore precisione strutturale

Netflix rilascia VOID, l’AI che rimuove oggetti dai video mantenendo la coerenza fisica della scena

Copilot e le clausole “solo per intrattenimento” nei servizi AI di Microsoft

Sistemi multi-agente: i modelli AI si proteggono tra loro