Tencent ha presentato Hunyuan3D 2.0, un avanzato sistema di intelligenza artificiale capace di trasformare immagini singole o descrizioni testuali in modelli 3D dettagliati nel giro di pochi secondi. Questa innovazione riduce drasticamente i tempi di produzione di asset 3D, passando da giorni o settimane a una manciata di secondi, automatizzando un processo tradizionalmente lungo e complesso.
Proseguendo sulla scia del suo predecessore, Hunyuan3D 2.0 è disponibile come progetto open-source sulle piattaforme Hugging Face e GitHub, rendendo immediatamente accessibile questa tecnologia a sviluppatori e ricercatori di tutto il mondo. Il team di ricerca di Tencent sottolinea come la creazione di asset 3D di alta qualità sia storicamente un processo che richiede molto tempo agli artisti, rendendo l’automazione della generazione un obiettivo a lungo termine per i ricercatori.
Hunyuan3D 2.0 si basa su due componenti principali: Hunyuan3D-DiT, che crea la forma di base, e Hunyuan3D-Paint, che aggiunge i dettagli superficiali. Il sistema genera inizialmente multiple viste 2D di un oggetto, per poi assemblarle in un modello 3D completo. Una nuova metodologia di guida assicura che tutte le viste dell’oggetto siano coerenti tra loro, risolvendo un problema comune nei modelli 3D generati dall’IA. I ricercatori spiegano che posizionano le telecamere a specifiche altezze per catturare l’area massima visibile di ciascun oggetto, combinando diverse prospettive per cogliere dettagli che altri modelli spesso trascurano, specialmente nelle parti superiori e inferiori degli oggetti.
I risultati tecnici sono notevoli: Hunyuan3D 2.0 produce modelli più accurati e visivamente accattivanti rispetto ai sistemi esistenti, secondo le misurazioni standard del settore. La versione standard è in grado di creare un modello 3D completo in circa 25 secondi, mentre una versione più piccola e veloce impiega solo 10 secondi. Ciò che distingue Hunyuan3D 2.0 è la sua capacità di gestire input sia testuali che visivi, rendendolo più versatile rispetto alle soluzioni precedenti. Il sistema introduce inoltre funzionalità innovative come la “guida adattiva senza classificatore” e gli “input ibridi” che aiutano a garantire coerenza e dettaglio nei modelli 3D generati.