Alibaba e la Creazione di Avatar 3D con Make-A-Character

Alibaba sta rivoluzionando il modo in cui creiamo avatar digitali. Con il suo nuovo strumento Make-A-Character, o Mach, la società trasforma le descrizioni testuali in avatar visivi 3D personalizzati, facilitando la creazione di personaggi digitali per gli utenti.

Trasformazione di Testo in Avatar 3D: La Tecnologia di Make-A-Character

Make-A-Character utilizza modelli linguistici e visivi avanzati per generare avatar 3D dettagliati e realistici a partire da descrizioni in linguaggio naturale. Inizialmente, il modello si concentra sulla creazione di avatar di etnia asiatica, data la prevalenza di immagini facciali asiatiche nel database di apprendimento. I ricercatori stanno lavorando per estendere le capacità del modello a diverse etnie e stili.

Dettagli e Limitazioni dell’Avatar Generato

Attualmente, Mach produce avatar con trame facciali pulite, evitando modelli non naturali come scarabocchi o adesivi. Gli avatar vengono creati abbinando pre-esistenti parti del corpo e indumenti in base alla somiglianza con la descrizione testuale. I ricercatori sono impegnati nello sviluppo di nuove tecniche per migliorare gli aspetti come l’espressione del viso e il movimento, basandosi su suggerimenti testuali.

Il Processo di Creazione dell’Avatar

Mach trasforma le descrizioni testuali in attributi semantici che vengono mappati su indizi visivi. Questi indizi guidano la generazione di immagini di ritratto di riferimento utilizzando tecnologie come Stable Diffusion e ControlNet. Dopo l’analisi facciale 2D e la generazione 3D, la mesh e le texture del volto vengono assemblate insieme a accessori aggiuntivi. La rappresentazione parametrizzata dell’avatar facilita l’animazione 3D.

Innovazioni Recenti di Alibaba nell’IA

Recentemente, Alibaba ha introdotto Richdreamer, un modello di diffusione per la generazione di immagini 3D da 2D. Ha anche presentato “Animate Everyone”, una tecnologia che trasforma immagini statiche in video dinamici di personaggi.

Nel campo dei modelli linguistici, Alibaba ha lanciato Qwen-72B, un modello con parametri aumentati e personalizzazione migliorata. Questo segue il rilascio di Qwen-7B e un modello più piccolo, Qwen-1.8B, offerto alla comunità di ricerca con una lunghezza di contesto di 2K e un modesto requisito di memoria GPU.

Queste innovazioni rappresentano passi importanti nel campo della creazione digitale e dell’intelligenza artificiale, dimostrando il continuo impegno di Alibaba nel migliorare e diversificare le sue offerte tecnologiche.

 

Di ihal