In un annuncio che segna una svolta significativa nel campo dell’elaborazione AI all’edge, NTT Corporation ha presentato un chip di inferenza AI capace di processare video 4K in tempo reale a 30 fotogrammi al secondo, consumando meno di 20 watt di potenza. Questa innovativa integrazione su larga scala (LSI) rappresenta il primo esempio al mondo di un tale livello di prestazioni in ambienti con vincoli energetici, aprendo nuove possibilità per le applicazioni edge computing.
Nel tradizionale modello di cloud computing, i dati provenienti da dispositivi come droni o telecamere vengono inviati a data center remoti per essere processati e analizzati. Sebbene questo approccio offra una potenza di calcolo virtualmente illimitata, introduce ritardi dovuti alla trasmissione dei dati, risultando problematico per applicazioni in tempo reale come la navigazione autonoma o il monitoraggio della sicurezza.
L’edge computing, al contrario, elabora i dati localmente, sul dispositivo stesso o nelle sue immediate vicinanze. Questo riduce la latenza, preserva la larghezza di banda e consente analisi in tempo reale anche in ambienti con connettività internet limitata o intermittente. Inoltre, migliora la privacy e la sicurezza dei dati, minimizzando la necessità di trasmettere informazioni sensibili su reti pubbliche.
Il nuovo chip AI di NTT abbraccia pienamente questa filosofia edge-first, offrendo analisi video 4K in tempo reale direttamente sul dispositivo, senza dipendere dal cloud.
Con l’integrazione di questo chip, un drone può rilevare persone o oggetti fino a 150 metri di distanza, il limite legale di altitudine per i droni in Giappone. Questo rappresenta un miglioramento significativo rispetto ai sistemi AI in tempo reale tradizionali, generalmente limitati a un raggio di 30 metri a causa di risoluzioni o velocità di elaborazione inferiori.
Questa innovazione apre la strada a numerose nuove applicazioni, tra cui:
- Ispezioni infrastrutturali in luoghi difficili da raggiungere.
- Risposta ai disastri in aree con connettività limitata.
- Monitoraggio agricolo su vaste estensioni di terreno.
- Sicurezza e sorveglianza senza la necessità di connessioni cloud costanti.
Tutto ciò è reso possibile da un chip che consuma meno di 20 watt, un consumo energetico drasticamente inferiore rispetto alle centinaia di watt richiesti dai server AI basati su GPU, impraticabili per sistemi mobili o alimentati a batteria.
Le prestazioni dell’LSI si basano sul motore di inferenza AI sviluppato da NTT, che garantisce risultati rapidi e accurati minimizzando il consumo energetico. Le principali innovazioni includono:
- Correlazione interframe: confrontando sequenze di fotogrammi video, il chip riduce i calcoli ridondanti, migliorando l’efficienza.
- Controllo dinamico della precisione dei bit: questa tecnica regola dinamicamente la precisione numerica richiesta, utilizzando meno bit per compiti più semplici, risparmiando energia senza compromettere l’accuratezza.
- Esecuzione nativa di YOLOv3: il chip supporta l’esecuzione diretta di You Only Look Once v3, uno degli algoritmi di rilevamento oggetti in tempo reale più veloci nel machine learning.
Queste caratteristiche combinate permettono al chip di offrire prestazioni AI robuste in ambienti precedentemente considerati troppo limitati in termini di energia o larghezza di banda per un’inferenza avanzata.
NTT prevede di commercializzare il chip entro l’anno fiscale 2025 attraverso la sua società operativa, NTT Innovative Devices Corporation.
I ricercatori stanno già esplorando la sua integrazione nell’Innovative Optical and Wireless Network (IOWN), la visione di NTT per la prossima generazione di infrastrutture mirata a rinnovare la spina dorsale digitale della società moderna. All’interno dell’architettura Data-Centric Infrastructure (DCI) di IOWN, il chip sfrutterebbe l’All-Photonics Network per comunicazioni ultra-low latency e ad alta velocità, complementando la potenza di elaborazione locale che apporta ai dispositivi edge.
NTT sta inoltre collaborando con NTT DATA, Inc. per combinare le capacità del chip con la sua tecnologia di Attribute-Based Encryption (ABE), che consente un controllo di accesso sicuro e granulare sui dati sensibili. Insieme, queste tecnologie supporteranno applicazioni AI che richiedono sia velocità che sicurezza, come nel settore sanitario, nelle smart city e nei sistemi autonomi.