I ricercatori del MIT hanno sviluppato un nuovo metodo per generare immagini in “tempo reale”, chiamato Distribution Matching Distillation (DMD), che semplifica il processo di creazione rispetto al metodo tradizionale di diffusione. Invece di richiedere da 30 a 50 passaggi, il nuovo metodo del MIT esegue il tutto in un solo passaggio.
Questa innovazione riduce notevolmente il tempo di creazione e il carico computazionale. Mentre un metodo tradizionale impiega circa 1,5 secondi per creare un’immagine, il nuovo metodo del MIT richiede solo circa 1/500 di secondo.
La velocità dei modelli basati su DMD non è dovuta all’hardware potente, ma alla tecnologia che genera il contenuto visivo in un unico passaggio. Questo approccio combina i principi delle reti generative avversarie (GAN) e dei modelli di diffusione, garantendo una generazione più rapida mantenendo la qualità dell’immagine.
DMD apprende dai modelli di diffusione esistenti e utilizza la tecnologia GAN per generare immagini velocemente, mantenendo al contempo un alto livello di realismo. Questo metodo potrebbe rivoluzionare la modellazione generativa, offrendo sia velocità che qualità superiori.
Questo non è il primo tentativo di accelerare la generazione di immagini. Altri modelli come Stable Diffusion XL Turbo hanno ridotto il processo di creazione di 50 passaggi a un solo passaggio, ottenendo risultati simili in termini di velocità e qualità.