Una nuova tecnologia ha fatto la sua comparsa nel campo dell’intelligenza artificiale (IA) dedicata alla generazione di immagini, offrendo un approccio più semplice rispetto a LoRA. Questa tecnologia è in grado di produrre risultati coerenti in uno stile specifico basandosi su una sola foto, sfruttando il metodo di apprendimento “Zero-shot”.
Secondo quanto riportato da Venture Beat, la startup di Pechino chiamata InstantX ha presentato una soluzione innovativa chiamata “InstantID” per la creazione di immagini. Tuttavia, è importante sottolineare che InstantID non rappresenta una tecnologia completamente nuova, ma piuttosto un “modulo plug and play” che integra l’identità dell’immagine originale con un modello di generazione di immagini, come ad esempio SDXL. Questa integrazione avviene attraverso condizioni semantiche solide e condizioni spaziali più flessibili, combinando immagini di volti e punti di riferimento con suggerimenti di testo.
Ciò che rende InstantID interessante è la sua capacità di creare deepfake estremamente realistici e convincenti delle immagini originali, il tutto richiedendo risorse hardware GPU o CPU relativamente limitate.
L’articolo relativo a questa tecnologia, pubblicato nell’archivio, si intitola “Instant ID: Zero-shot Identity – Preserving Generation in Seconds”. La tecnologia “Zero Shot” consente a un modello di IA di riconoscere e generare contenuti relativi a identità mai precedentemente viste durante il processo di apprendimento.
Robben Cohen, un consulente aziendale esperto in intelligenza artificiale, ha commentato: “Mentre LoRA o QRora si concentrano sulla riduzione dei parametri durante la fase di messa a punto, Instant ID punta invece sulla generazione di output che conserva le caratteristiche identificative dei dati di input in modo rapido ed efficiente.” Ha poi aggiunto: “Questa tecnologia è come gli steroidi per i deepfake.”
Questa nuova tecnologia rappresenta un passo avanti nell’ambito della generazione di immagini e dell’elaborazione delle identità visive nell’intelligenza artificiale.
La società ha rilasciato il codice tramite GitHub.