I modelli basati sulla diffusione sono in aumento nel 2022 ed è qui che puoi iniziare a saperne di più su di loro
I modelli text-to-image hanno dominato il posatoio nel 2022. Modelli come DALL-E, Midjourney e Stable Diffusion hanno collettivamente rotto Internet poiché la maggior parte dei feed dei social media si è riempita di immagini generate da questi modelli. Questi modelli generativi hanno funzionato sul rinnovato algoritmo di apprendimento automatico – modelli di diffusione – che generano immagini aggiungendo e quindi rimuovendo il rumore in un’immagine.
Un artista o qualsiasi Joe normale su Internet potrebbe andare a questi modelli, inserire un prompt e voilà! Le immagini iniziano ad apparire. Ma un appassionato di machine learning potrebbe chiedersi come funzionano esattamente questi modelli di diffusione.
Dai un’occhiata a queste risorse che offrono spiegazioni approfondite sui modelli di diffusione da zero.
1 NVIDIA: miglioramento dei modelli di diffusione come alternativa ai GAN
Probabilmente il primo blog da consultare per capire i pro ei contro dell’utilizzo dei modelli di diffusione è quello di NVIDIA. I ricercatori hanno pubblicato questo blog per fornire una prospettiva sul motivo per cui i modelli di diffusione sono un’alternativa ai GAN. La seconda parte del blog offre una spiegazione approfondita del funzionamento dei modelli di diffusione.
Indirizzo https://developer.nvidia.com/blog/improving-diffusion-models-as-an-alternative-to-gans-part-1/
2 Assembly AI
Fornendo un approfondimento sul funzionamento di un modello di diffusione, il blog di Assembly AI è una delle maggiori risorse per entrare nel campo dell’IA generativa. Il blog copre informazioni approfondite su DALL-E 2, fornendo anche informazioni su come creare modelli di diffusione in Python.
. https://www.assemblyai.com/blog/diffusion-models-for-machine-learning-introduction/
3 Canale YouTube di Yannic Kilcher
Yannic Kilcher ha realizzato video che spiegano quasi ogni singola tendenza nel campo dell’apprendimento automatico. Il suo video, “DDPM – Diffusion Models Beat GANs on Image Synthesis”, spiega passo dopo passo il documento di ricerca di OpenAI. Con esempi sperimentali e spiegazioni di ogni parte del documento, il video è una risorsa utile per comprendere la ricerca alla base del nascente modello generativo.
4 HuggingFace Diffusion Model Course
Una lunga e vasta libreria di corsi per i modelli di diffusione, il repository GitHub di HuggingFace offre la teoria dei modelli di diffusione e poi spiega come addestrare i propri modelli e creare pipeline personalizzate. Il prerequisito del corso è avere una conoscenza di Python e delle basi di PyTorch.
https://github.com/huggingface/diffusion-models-class
5 Lilian Weng – Cosa sono i modelli di diffusione
Questo articolo su GitHub parte dalle basi dei modelli generativi come GAN, VAE e modelli basati su Flow e li confronta con i modelli di diffusione in aumento e ciò che li distingue. Il blog è specificamente migliore per gli appassionati di apprendimento automatico interessati a immergersi nella spiegazione matematica dei modelli di diffusione.
https://lilianweng.github.io/posts/2021-07-11-diffusion-models/
6 Leggi: Modelli di diffusione: dall’arte allo stato dell’arte
Un’introduzione ai modelli di diffusione
Un blog di Ayan Das , studente di dottorato presso l’Università del Surrey, spiega l’origine dei modelli di diffusione e dei suoi casi d’uso, collegandoli a modelli generativi basati su punteggi insieme alla spiegazione matematica. Das ha pubblicato vari articoli che spiegano il deep learning in campi come la visione artificiale ed è anche revisore in conferenze come ICCV, SIGGRAPH, ACM e BMVC.
https://ayandas.me/blog-tut/2021/12/04/diffusion-prob-models.html
7 Modellazione generativa stimando i gradienti della distribuzione dei dati
Yang Song della Stanford University ha pubblicato il suo blog sui modelli generativi e ha parlato dei modelli di diffusione. Ha spiegato come i modelli basati sulla verosimiglianza e quelli generativi impliciti siano utili, ma il campo dell’IA generativa si sta spostando verso modelli di diffusione e si stanno dimostrando strumenti essenziali a causa delle loro capacità di denoising.
https://yang-song.net/blog/2021/score/.
8 Modelli di diffusione come una sorta di VAE
Mentre Ayan Das ha collegato i modelli di diffusione ai modelli basati sui punteggi, Agnus Turner li ha collegati ai VAE. Il blog spiega come il documento di ricerca di OpenAI abbia nuovamente risparmiato l’interesse dei ricercatori nel campo dell’IA generativa e i modelli di diffusione si siano rivelati il punto di svolta.
https://angusturner.github.io/generative_models/2021/06/29/diffusion-probabilistic-models-I.html
DI MOHIT PANDEY da analyticsindiamag.com