Un modello di intelligenza artificiale in grado di catturare immagini molto sfocate e pixellate e renderle con dettagli elevati 64 volte la risoluzione dell’immagine originale

Il modello AI può scattare immagini sfocate e migliorare la risoluzione di 60 volte
I ricercatori della Duke University hanno sviluppato un modello di intelligenza artificiale in grado di catturare immagini molto sfocate e pixellate e renderle con dettagli elevati. Secondo TechXplore , il modello è in grado di prendere relativamente pochi pixel e ridimensionare le immagini per creare facce dall’aspetto realistico che sono circa 64 volte la risoluzione dell’immagine originale. Il modello allucina o immagina le caratteristiche che si trovano tra le linee dell’immagine originale.

La ricerca è un esempio di super risoluzione. Come ha spiegato a TechXplore Cynthia Rudin del team di informatica della Duke University , questo progetto di ricerca ha stabilito un record per la super risoluzione, come mai prima d’ora sono state create immagini con tale raffinatezza da un così piccolo campione di pixel di partenza. I ricercatori sono stati attenti a sottolineare che il modello in realtà non ricrea il volto della persona nell’immagine originale di bassa qualità. Invece, genera nuovi volti, riempiendo dettagli che prima non c’erano. Per questo motivo, il modello non potrebbe essere utilizzato per nulla come i sistemi di sicurezza, in quanto non sarebbe in grado di trasformare le immagini di messa a fuoco in immagini di una persona reale.

Le tecniche tradizionali di super-risoluzione operano ipotizzando quali pixel sono necessari per trasformare l’immagine in un’immagine ad alta risoluzione, sulla base di immagini che il modello ha appreso in precedenza. Poiché i pixel aggiunti sono il risultato di ipotesi, non tutti i pixel corrisponderanno ai pixel circostanti e alcune aree dell’immagine potrebbero apparire sfocate o deformate. I ricercatori della Duke University hanno utilizzato un metodo diverso per addestrare il loro modello di intelligenza artificiale. Il modello creato dai ricercatori di Duke opera acquisendo prima le immagini a bassa risoluzione e aggiungendo dettagli all’immagine nel tempo, facendo riferimento ai volti generati dall’IA ad alta risoluzione come esempi. Il modello fa riferimento alle facce generate dall’intelligenza artificiale e cerca di trovare quelle che somigliano alle immagini di destinazione quando le facce generate vengono ridimensionate in base alla dimensione dell’immagine di destinazione.

Il team di ricerca ha creato un modello di rete generativa dell’avversario per gestire la creazione di nuove immagini. I GAN sono in realtà due reti neurali che sono entrambe addestrate sullo stesso set di dati e confrontate. Una rete è responsabile della generazione di immagini false che imitano le immagini reali nel set di dati di addestramento, mentre la seconda rete è responsabile del rilevamento delle immagini false da quelle autentiche. La prima rete viene notificata quando le sue immagini sono state identificate come false e migliora fino a quando le immagini fasulle non sono indistinguibili dalle immagini originali.

I ricercatori hanno soprannominato il loro modello di super risoluzione PULSE e il modello produce costantemente immagini di alta qualità anche se le immagini sono così sfocate che altri metodi di super risoluzione non possono creare da loro immagini di alta qualità. Il modello è persino in grado di realizzare facce dall’aspetto realistico da immagini in cui le caratteristiche del volto sono quasi indistinguibili. Ad esempio, quando viene data un’immagine di un viso con risoluzione 16 × 16, può creare un’immagine 1024 x 1024. Durante questo processo vengono aggiunti più di un milione di pixel, riempiendo dettagli come ciocche di capelli, rughe e persino illuminazione. Quando i ricercatori hanno valutato le persone con 1440 immagini generate da PULSE rispetto alle immagini generate da altre tecniche di super risoluzione, le immagini generate da PULSE hanno ottenuto costantemente il punteggio migliore.

Mentre i ricercatori hanno usato il loro modello sulle immagini dei volti delle persone, le stesse tecniche che usano potrebbero essere applicate a quasi tutti gli oggetti. Le immagini a bassa risoluzione di vari oggetti potrebbero essere utilizzate per creare immagini ad alta risoluzione di quell’insieme di oggetti, aprendo possibili applicazioni per una varietà di settori e settori diversi da microscopia, immagini satellitari, istruzione, produzione e medicina.

Un modello di intelligenza artificiale in grado di catturare immagini molto sfocate e pixellate e renderle con dettagli elevati 64 volte la risoluzione dell’immagine originale

Diihal

Di ihal

Articoli correlati

Ultimi Post

Anthropic lancia Claude Opus 5 per ridurre il costo dei carichi di lavoro AI complessi

Un’interruzione globale colpisce ChatGPT, le API OpenAI e Codex

Google estende Gemini Spark agli abbonati AI Pro negli Stati Uniti

Kimi K3 resta indietro nei test di attacco informatico autonomo