Apple ha presentato Depth Pro, un nuovo modello di intelligenza artificiale che riscrive le regole della visione 3D. Questo sistema innovativo è in grado di creare mappe di profondità 3D dettagliate partendo da semplici immagini 2D in una frazione di secondo, senza bisogno di dati aggiuntivi dalla fotocamera. Questo progresso potrebbe rivoluzionare settori come la realtà aumentata e i veicoli autonomi, dove la percezione accurata della profondità è essenziale.
Il modello Depth Pro, sviluppato dal team di ricerca AI di Apple, supera gli altri sistemi nella cattura di dettagli fini, come peli e fili, grazie alla sua capacità di generare mappe di profondità nitide in soli 0,3 secondi. Non necessita di metadati aggiuntivi, rendendolo una soluzione rapida e versatile per la percezione della profondità.
Un aspetto unico di Depth Pro è la sua capacità di stimare sia la profondità relativa sia quella assoluta, fondamentale per applicazioni come la realtà aumentata, in cui è importante posizionare oggetti virtuali in modo preciso nello spazio reale. Inoltre, grazie al cosiddetto “apprendimento zero-shot”, Depth Pro può essere utilizzato su immagini di vari contesti senza bisogno di training specifico.
Questa tecnologia ha implicazioni significative per diversi settori. Nell’e-commerce, ad esempio, può permettere ai clienti di vedere come si adattano i mobili nella loro casa usando la fotocamera del telefono. Nel settore automobilistico, Depth Pro potrebbe migliorare la percezione dell’ambiente da parte delle auto a guida autonoma, contribuendo a una navigazione più sicura.
Per chi è curioso, è disponibile una demo di Depth Pro su Hugging Face, e Apple ha reso open source il codice su GitHub per favorire ulteriori sviluppi e applicazioni in campi come la robotica, la produzione e l’assistenza sanitaria.
Depth Pro rappresenta un passo avanti importante nella stima della profondità, grazie alla sua velocità e accuratezza. Con la sua apertura alla comunità, questa tecnologia ha il potenziale di trasformare il modo in cui macchine e persone interagiscono con il mondo tridimensionale.