PERCHÉ DOVRESTI IMPARARE COMPUTER VISION ADESSO

Nel 1966, Seymour Papert e Marvin Minsky , lanciarono il Summer Vision Project, un esperimento scientifico per cercare di ottenere un computer per identificare oggetti e modelli all’interno di un’immagine.

Per eseguire l’attività, il computer ha dovuto correlare i pixel con l’oggetto per identificarlo. Per noi, è facile utilizzare le nostre capacità cognitive e identificare oggetti o schemi all’interno di una particolare cornice, nonché ricordare odori, suoni, sensazioni tattili e attaccamento sensoriale a quel particolare scenario. Ma per un computer, questo è un compito più matematico.

Computer Vision (CV) si è drasticamente evoluto nel corso degli anni, dalla semplice identificazione di modelli al riconoscimento facciale e ai veicoli autonomi (AV). Questa è una delle aree chiave di competenza nel campo dei sistemi intelligenti (AI, ML, DL) e, quindi, un’arena in continua crescita che richiede la tua attenzione.

Ecco 5 motivi per cui dovresti imparare CV:

  1. Le immagini sono ovunque
    Molti dati disponibili. I dati sono il nuovo olio. Ad esempio, la fotocamera del tuo cellulare costituisce una fonte inesauribile di contenuti per sfruttare e sviluppare applicazioni che vanno dall’avanguardia, all’innovazione, all’assurdo, al divertimento e al divertimento.

W3Schools
L’enorme volume di immagini che una piattaforma come Snapchat genera ogni ora, richiederebbe a un essere umano di trascorrere 10 anni della sua vita per esaminarle tutte. E questo è solo il caso di una delle innumerevoli piattaforme, social network e applicazioni che abbondano sul mercato.

Instagram è il primo che viene in mente, ma c’è anche YouTube, il secondo motore di ricerca più grande su Internet, di proprietà di Google.

Allo stesso modo, le piattaforme il cui focus iniziale era sul testo e altre forme di contenuto statico, come Facebook o Twitter, hanno definitivamente adottato il video senza esitazione come formato principale per la trasmissione delle informazioni.

Ora, con petabyte di dati visivi generati ogni giorno, la visione del computer è il campo dell’intelligenza artificiale con il più grande potenziale di crescita a breve, medio e lungo termine, poiché è impossibile elaborare un tale volume di informazioni senza il supporto del neuronale reti, nonché gli sviluppi a venire.

Leggi anche The Glass

  1. È l’area più influente dell’IA
    Stiamo percorrendo un percorso che cambierà il modo di connetterci, interagire e sviluppare su base giornaliera. L’impatto dei cambiamenti in corso sarà paragonabile solo all’emergere di Internet.

È chiaro che l’attore principale in questa commedia è Artificial Intelligence. Tuttavia, AI è un termine molto ampio, che comprende innumerevoli sottocampi, ognuno dedicato all’esplorazione e allo sfruttamento di un problema, una nicchia specifica. Ciononostante, i più recenti progressi nel settore, in particolare nel deep learning, sono stati generati nei confini, nel forum interno della visione artificiale.

È stato nel 2012 che il termine deep learning ha colto di sorpresa l’industria, e ciò è in gran parte dovuto al rilascio di AlexNet nella ILSVRC di quell’anno – ImageNet Challenge su larga scala del riconoscimento visivo – dove, per la prima volta, una rete neurale ha dominato la scena , ottenendo un vantaggio di 10 punti rispetto all’avversario più vicino.

Da lì in poi, ogni anno il bar è stato alzato un po ‘di più. I team che hanno partecipato a questa sfida hanno mostrato maggiore audacia, visione e coraggio, fornendo architetture, algoritmi e soluzioni non banali, ma che alla fine hanno alimentato, promosso e rafforzato un’intera comunità.

Uno dei grandi contributi all’umanità nell’area della visione artificiale è l’apprendimento dei trasferimenti, un meccanismo attraverso il quale possiamo trarre vantaggio dalla conoscenza di reti addestrate in enormi set di dati come ImageNet e ottenere risultati abbastanza soddisfacenti con dati relativamente scarsi.

In breve, la visione artificiale ha democratizzato l’apprendimento profondo.

  1. Potenziale gigantesco
    Quanti pazienti con retinopatia diabetica può vedere un medico lo stesso giorno? Come si muove un individuo cieco?

Gli esseri umani, come specie, hanno raggiunto livelli inimmaginabili in termini di aspettativa di vita, salute, benessere, distribuzione di opportunità e accesso alle risorse. È innegabile che la tecnologia abbia svolto un ruolo di primo piano nei nostri risultati e, sebbene abbiamo fatto abbastanza, non abbiamo ancora sviluppato tutto il nostro potenziale.

Ma come? Iniziamo tutti la giornata con 24 ore. Anche il professionista di successo più dedicato ha una vita, una famiglia, una casa e delle responsabilità cui occuparsi.

La risposta non sta nel sostituire il lavoro umano con l’intelligenza artificiale o nel lavorare più a lungo, ma piuttosto nell’esponenziare le capacità cognitive, le competenze e gli anni di duro apprendimento dei nostri esperti attraverso la visione computerizzata.

Tutte le domande aperte nel primo paragrafo di questa sezione pongono problemi ancora irrisolti. Diamo un’occhiata a loro:

-Quanti pazienti con retinopatia diabetica possono vedere un medico lo stesso giorno? Dozzine, ma supportate da una rete neurale addestrata in migliaia di immagini, potrebbero essercene migliaia

-Come si muove un individuo cieco? Con molto aiuto esterno, quando è disponibile, ma attraverso la visione computerizzata, una parte fondamentale dello sviluppo di veicoli autonomi, con la tua sola voce potresti dire alla tua auto dove andare, che sarebbe guidato da una serie di telecamere e sensori, mappatura, comprensione e presa di decisioni basate sul cambiamento

  1. Il mix ideale di arte e scienza
    Raramente incontriamo una disciplina che abbraccia le arti così da vicino, senza trascurare il metodo scientifico. La visione artificiale appartiene a questa rara categoria.

Senza andare troppo lontano, le reti neurali convoluzionali sono ispirate dal meccanismo biologico che opera agli occhi della maggior parte delle specie animali, utilizzate per scomporre e interpretare le informazioni visive.

Leggi anche errori cruciali Dati amatoriali che gli scienziati dovrebbero evitare
Le reti neurali sono una concettualizzazione del groviglio di cellule che esistono nel nostro cervello, dove vive la nostra identità, le nostre emozioni sono generate e le nostre azioni sono pianificate. Questa ispirazione biologica è sfruttata da una profonda conoscenza delle leggi della probabilità e della statistica, attraverso la quale possiamo congetturare sul livello di comprensione di un algoritmo.

Tuttavia, non tutto ciò che facciamo nella visione artificiale si riduce alla categorizzazione e alla ricerca di elementi nelle foto. Possiamo anche generare arte e persino allucinazioni.

Non solo possiamo sognare; anche reti neurali. E, alla fine, tutto ciò è alimentato dalla matematica.

  1. Il CV è un percorso di comprensione di sé
    Non è bello come tutta questa tecnologia costosa, spaziosa e sofisticata non sia in grado di competere con la rete neurale più avanzata di tutte: il nostro cervello?

Tutta la potenza di titani come Google, Amazon o Microsoft non è sufficiente per risolvere alcune attività quotidiane che la nostra massa grigia, con solo 1,5 kg di peso, alimentata da una minuscola quantità di elettricità, può svolgere in un attimo.

La chiave è nelle nostre teste. Non è stato fino ai primi anni ’90, quando Yann LeCun ha introdotto la sua rete LeNet seminale, ispirata alla corteccia visiva degli animali, al mondo che il campo delle reti neurali si è svegliato dal suo sonno profondo, considerato da molti all’epoca un’utopia a causa di il gran numero di risorse e la mancanza di praticità.

Pertanto, la visione computerizzata come area di ricerca e applicazione, è un percorso verso la scoperta di sé, poiché è attraverso di essa che siamo costretti a capire meglio come lavoriamo, come operiamo, cosa ci rende speciali e come il nostro carbonio- il design basato può essere replicato per rendere il mondo un posto migliore.

Di ihal