L’API di Stable Video Diffusion di Stability AI: creare video con facilità

Stability AI, l’azienda famosa per il suo generatore di testo-immagine “Stable Diffusion”, ha annunciato con entusiasmo che il suo nuovo modello di base per la generazione di immagini e video, chiamato “Stable Video Diffusion” (SVD), è ora disponibile sulla sua piattaforma di sviluppo e tramite la sua interfaccia di programmazione delle applicazioni (API). Questo permette agli sviluppatori di terze parti di incorporare il modello nelle proprie applicazioni, siti web, software e servizi.

L’azienda ha scritto in un post sul blog: “Questa nuova aggiunta offre un accesso programmatico a un modello video all’avanguardia progettato per diversi settori… Il nostro obiettivo con questa versione è fornire agli sviluppatori un modo efficiente per integrare senza sforzo la generazione video avanzata nei loro prodotti”.

Tuttavia, nonostante il potenziale vantaggio per le aziende interessate a generare video con l’IA, c’è un aspetto controverso da considerare. Stability AI è già sotto accusa per aver addestrato i suoi modelli su LAION-5B, un set di dati open source che è stato scoperto contenere almeno 1.008 casi di materiale pedopornografico. Questo ha portato alla rimozione del set di dati questa settimana.

Nonostante queste critiche, per coloro che desiderano integrare la generazione di video nelle proprie applicazioni, gli SVD API di Stability offrono opzioni di alta qualità, producendo “video di 2 secondi, composti da 25 fotogrammi generati e 24 fotogrammi di interpolazione FILM, in un tempo medio di 41 secondi”, secondo una pubblicazione di Stability AI sulla sua pagina LinkedIn. Questo potrebbe non essere sufficiente per progetti video su larga scala, ma è certamente utile per creare GIF con messaggi specifici, compresi meme divertenti.

A differenza di alcune altre offerte di generazione video come Runway e Pika Labs, Stability ha reso disponibili i propri modelli di intelligenza artificiale tramite un’API, consentendo agli sviluppatori di terze parti di integrarli direttamente nelle proprie applicazioni, siti web e servizi. Questo è un passo avanti significativo nel campo della generazione video basata su intelligenza artificiale.

Inoltre, Stability prevede di lanciare presto un’esperienza web rivolta agli utenti per il suo generatore di video, anche se la data di disponibilità non è stata specificata. L’azienda ha invitato gli interessati a unirsi alla lista d’attesa per essere tra i primi a provare l’interfaccia.

Stable Video Diffusion, annunciato quasi un mese fa in anteprima della ricerca, consente agli utenti di generare video MP4 partendo da immagini fisse, compresi file JPG e PNG. I risultati iniziali sembrano promettenti, anche se il modello attuale è limitato nella durata dei video, che raggiungono al massimo i due secondi. Tuttavia, è possibile concatenare più clip video per creare video più lunghi.

Stability sostiene che questo modello può essere utile in settori come la pubblicità, il marketing, la televisione, il cinema e i giochi. Inoltre, offre diverse opzioni di layout e risoluzione, tra cui 1024×576, 768×768 e 576×1024. Inoltre, include funzionalità come il controllo della forza del movimento e il controllo basato sui semi, che permette agli sviluppatori di scegliere tra una generazione ripetibile o casuale.

Sebbene il lancio di Stable Video Diffusion offra alle aziende un modo conveniente per integrare la generazione video nei propri prodotti, è importante notare che Stability AI è al centro di controversie riguardanti la fonte dei suoi dati di addestramento e ha affrontato azioni legali in passato.

Attualmente, l’API della piattaforma per sviluppatori di Stability offre l’accesso a tutti i modelli aziendali, dal generatore di testo-immagine Stable Diffusion XL al nuovo modello SVD. L’azienda offre anche un abbonamento per aiutare i clienti a ospitare i modelli localmente.

L’API di Stable Video Diffusion di Stability AI: creare video con facilità

DiFantasy

Di Fantasy

Articoli correlati

Moonshot AI sospende i nuovi abbonamenti a Kimi K3 per carenza di capacità GPU

ComiXR porta fumetti e webtoon negli ambienti di realtà estesa

Frozen v2: il chip Google che integrerà parti di Gemini direttamente nell’hardware

Ultimi Post

Moonshot AI sospende i nuovi abbonamenti a Kimi K3 per carenza di capacità GPU

ComiXR porta fumetti e webtoon negli ambienti di realtà estesa

Frozen v2: il chip Google che integrerà parti di Gemini direttamente nell’hardware

Kimi K3 sposta il fabbisogno dell’infrastruttura AI dalla potenza di calcolo alla memoria HBM