Stability AI sta ampliando oggi il proprio portafoglio di modelli di intelligenza artificiale generativa con il lancio di Stable Video 3D (SV3D).
Il nuovo modello è uno strumento video AI gen per il rendering di video 3D, basato sulla tecnologia Stable Video di Stability AI. Questa tecnologia consente agli utenti di generare brevi video da un’immagine o da un messaggio di testo. SV3D si basa sul precedente modello Stable Video Diffusion di Stability AI, adattandolo per il compito di nuova sintesi di viste e generazione 3D.
Con SV3D, Stability AI aggiunge nuova profondità al suo modello di generazione video, consentendo la creazione e la trasformazione di mesh 3D multi-vista da una singola immagine di input.
L’azienda ha reso disponibile SV3D per uso commerciale tramite abbonamento al piano Professional di Stability AI. Per scopi non commerciali, gli utenti possono scaricare i pesi del modello da Hugging Face.
Il modello è stato descritto come uno strumento prezioso per la generazione di risorse 3D, soprattutto nel settore dei giochi, e permette la produzione di video orbitali a 360 gradi, utili nell’e-commerce per fornire un’esperienza di acquisto più coinvolgente e interattiva.
Stability AI è conosciuta soprattutto per i suoi modelli AI di generazione testo-immagine Stable Diffusion, tra cui SDXL e Stable Diffusion 3.0, quest’ultimo ancora in fase di ricerca preliminare. Nel dicembre 2023 è stato rilasciato il modello Stable Zero123, il primo di una serie di modelli 3D.
Il nuovo SV3D adotta un approccio diverso alla generazione 3D rispetto a Stable Zero123, producendo più visualizzazioni innovative contemporaneamente e fornendo viste di migliore qualità.
Oltre alle sue nuove capacità di sintesi delle viste, SV3D mira anche a ottimizzare le mesh 3D, generando mesh di alta qualità direttamente dalle nuove viste che produce.
SV3D è disponibile in due varianti, ciascuna progettata per casi d’uso specifici: SV3D_u per la generazione di video orbitali basati su singole immagini, e SV3D_p che consente agli utenti di creare video 3D lungo percorsi di telecamera specificati.