Questa intelligenza artificiale crea automaticamente filmati da centinaia di telefoni

Centinaia, forse migliaia di persone stanno scattando foto e video con i loro smartphone. Ognuno sta catturando una piccola fetta di realtà. Ognuno sta ottenendo il meglio di ciò che potrebbe essere perfetto dal proprio angolo, ciò che è visibile dal proprio punto di vista.

E se potessi creare automaticamente un film da tutti loro, all’istante?
Questo è esattamente ciò su cui sta lavorando IMINT . IMINT è un’azienda svedese di cui non hai mai sentito parlare la cui tecnologia Vidhance utilizza il deep learning per chiarire, correggere automaticamente, migliorare e migliorare in altro modo i video in oltre 250 milioni di smartphone a livello globale. Ora la società, che è stata principalmente un fornitore di software B2B, sta lavorando a una versione del software rivolta ai consumatori.

Tre tipi di disinformazione in questa elezione e come possiamo combatterla
Potremmo creare ricordi di film migliori combinando le risorse di centinaia o migliaia di smartphone utilizzando l’IA?

“Posso essere a un evento con mia moglie e i miei figli, e quando torno a casa, è come se volessi davvero unire i miei video perché qualcun altro ha avuto una prospettiva migliore su qualcosa”, mi ha detto di recente il CTO Johan Svensson sul podcast TechFirst . “Ma non arrivo mai al punto in cui effettivamente carico tutto questo sul mio computer e avvio il mio software di editing e lo faccio. Quindi … abbiamo capito che questo poteva effettivamente essere fatto in un modo più automatico – in pratica, completamente automatizzato ora con … AI. “

Gli algoritmi di elaborazione video possono trovare la regione di interesse nei video, afferma IMINT, e in futuro aumenteranno automaticamente lo zoom e si concentreranno in modo intelligente su ciò che stanno vedendo: un gol segnato a una partita di calcio, le candeline della torta di compleanno esplodere, o nel momento in cui il ritmo cala nel club.

“La prossima ondata di creazione di video sarà uno sforzo della comunità, unendo in modo intelligente video da più smartphone in un prodotto finito”, afferma IMINT. “Immagina un matrimonio con 200 invitati e quasi altrettanti smartphone che registrano l’evento … Un individuo, un gruppo o una famiglia può registrare lo stesso evento e generare facilmente un video dall’aspetto raffinato con più angolazioni, effetti, transizioni e altro ancora. Alla fine, una folla ancora più grande – amici e sconosciuti – sarà in grado di condividere simultaneamente il video dello smartphone da un concerto, una festa, un raduno o un altro raduno e metterlo insieme per raccontare storie visive che nessuno è stato in grado di raccontare prima senza uno sforzo considerevole . “

Le soluzioni automatizzate sono utili per creare ricordi dopo il fatto, perché chi ha davvero il tempo di sedersi e fare filmati o presentazioni dalle 950 foto e video che hanno scattato durante la loro ultima vacanza.

Ma questo è diverso.

Si tratta di un cloud-based che acquisisce video da un gruppo di smartphone, controlla metadati come il posizionamento GPS, la risoluzione del sensore, la risoluzione effettiva, il movimento, la direzione in cui puntano i telefoni (grazie al magnetometro nel tuo smartphone), mette in correlazione gli oggetti comuni trovati nel video e crea automaticamente un filmato collaborativo dei momenti salienti dell’evento.

“Useremo gli stessi algoritmi per trovare i momenti di punta e i momenti salienti di questi video, quindi compilarli semplicemente in … una selezione migliore di quella che abbiamo visto finora”, dice Svensson. “Possiamo effettivamente gestire flussi paralleli in un modo più simile a come una troupe di produzione professionale.”

Ascolta l’intervista dietro questa storia sul podcast TechFirst :

La prima uscita, prevista per un po ‘di tempo questo mese, sarà per piccoli gruppi di telecamere. Alla fine il software offrirà supporto per sempre più smartphone. Uno dei vantaggi dell’attenzione a lungo termine dell’azienda sull’intelligenza artificiale e sul deep learning è che con l’identificazione degli oggetti il ​​software potrebbe eventualmente determinare gli eventi principali vedendo quante telecamere sono puntate su una scena specifica in un dato momento, così come evidenziare l’azione al periferia che solo pochi o anche solo una persona hanno notato.

Una cosa che sarà incredibilmente utile?

5G.

Questo approccio consuma molti dati: il caricamento di video è faticoso sulla maggior parte delle reti cellulari 4G e inferiori, anche se il WiFi può andare bene. Ma il 5G potrebbe rendere tutto ciò quasi senza soluzione di continuità quando i video vengono caricati in background senza particolari problemi o degrado della qualità.

IMINT fa già affari con “la maggior parte dei produttori di smartphone del mondo”, afferma Svensson, e quei telefoni dovrebbero essere in grado di partecipare immediatamente. Gli altri telefoni dovranno prima scaricare un’app.

La privacy è chiaramente un problema con una tecnologia come questa.

Una cosa che viene in mente con le recenti marce di Black Lives Matter e alcuni degli incidenti con la polizia è il numero di telefoni che sembrano essere sempre fuori e registrare. In qualità di azienda europea, IMINT è molto consapevole delle implicazioni sulla privacy e solo i telefoni collegati tramite l’applicazione basata su cloud dell’azienda possono caricare e condividere video. Quello che succede dopo, ovviamente, è nessuno lo sa.

Almeno IMINT non ha intenzione di lanciare lo strumento completamente formato nel mondo. Rilascerà il software in modo iterativo e risponderà a ciò che le persone ne fanno.

“Quindi installeremo uno strumento là fuori e monitoreremo come viene effettivamente utilizzato, e poi rafforzeremo quelle aree”, dice Svensson.

Alla fine, potremmo essere in grado di navigare attraverso eventi e feste globali che ci siamo persi in film creati automaticamente che catturano l’essenza dell’evento, senza alcun lavoro extra da parte dei partecipanti effettivi. Potrebbe essere possibile dal vivo, con l’opportunità di passare da una telecamera all’altra fino a trovare la vista più interessante.

Il futuro, dicono, sarà televisivo.

Forse da tutti noi, in modo collaborativo.

Di ihal