AI Cambrian Explosion: previsioni 2021

Negli ultimi due anni, a gennaio, ho pubblicato le mie previsioni sul nuovo silicio AI che mi aspetto per il prossimo anno. Come il meteorologo, ho sbagliato alcuni dettagli ma sono stato ragionevolmente preciso, almeno dal punto di vista direzionale. Quindi, eccoci di nuovo con uno sguardo ai probabili progressi del 2021 e ai possibili fallimenti. Non baso nessuna di queste previsioni su informazioni interne o NDA;

NVIDIA manterrà la sua posizione dominante nell’intelligenza artificiale dei data center. Oltre a dominare quasi il 100% del mercato della formazione, NVIDIA guadagnerà più trazione nell’elaborazione dell’inferenza cloud grazie alla sua nuova GPU multi-istanza. La funzionalità MIG su NVIDIA A100 fornisce ai CSP maggiore flessibilità e può ridurre i costi di provisioning dell’hardware. Il settore Automotive di NVIDIA inizierà a registrare una crescita alla fine dell’anno.
NVIDIA acquisirà con successo Arm, sfruttando il modello di business delle licenze per monetizzare le tecnologie che Jensen Huang non si preoccupa di produrre.
Anche se mi sbaglio riguardo all’acquisizione di Arm, NVIDIA annuncerà un server basato su Arm per consentire uno stretto accoppiamento di CPU e GPU. (Il server potrebbe non essere spedito fino al 2022.)
Il richiamo di un progetto di chip interno costringerà la maggior parte dei data center iperscalabili “Super Seven” a lanciare processori di inferenza AI proprietari. Questi chip saranno personalizzati per casi d’uso e esigenze aziendali specifici, con un impatto principalmente su Intel Xeon e creeranno enormi venti contrari per le startup.
Le prestazioni e l’efficienza energetica della piattaforma Qualcomm AI100 garantiranno la vittoria di almeno un data center iperscalabile, nonostante la tendenza sopra indicata. Se ciò non dovesse accadere, Qualcomm potrebbe interrompere i suoi sforzi nel data center.
Google lancerà il TPU4, che è stato anticipato a luglio quando la società ha pubblicato i benchmark mlPerf che hanno più che raddoppiato i risultati del design precedente. Google annuncerà anche una seconda generazione di Edge TPU; il vantaggio è troppo significativo perché Google non lo possa perdere.
Intel otterrà almeno una grande vittoria di design per Habana Gaudi, sfruttando la vittoria di AWS annunciata a dicembre . In tal caso, Gaudi guadagnerà probabilmente la pole position per competere con NVIDIA.
Intel rilascerà un chip di inferenza Habana Goya aggiornato o lascerà silenziosamente morire Goya, concentrandosi invece sui processori Xeon. Scommetto su quest’ultimo.
Graphcore annuncerà almeno una significativa vittoria di design, forse Microsoft. Altri che sembrano promettenti includono Tenstorrent , Blaize , SambaNova e Groq . Tuttavia, il 2021 è un anno decisivo per molte startup.
L’ultimo è facile: qualcuno comprerà qualcun altro. Seriamente, le startup con una tecnologia promettente, come Cerebras, SambaNova, Tenstorrent, Blaize e Graphcore, possono sembrare costose ma sono piuttosto preziose. Aziende come AMD, NVIDIA, Facebook e Google possono permettersi di pagare per una piattaforma che potrebbe rappresentare una svolta duratura.
Conclusioni

Nel 2020, l’AI Cambrian Explosion è passata dai tavoli da disegno ai data center e ai dispositivi periferici. Mi aspetto che il 2021 introduca decine di nuovi chip per accelerare l’IA, sia dalle startup che dai grandi fornitori di semiconduttori. Il panorama dell’intelligenza artificiale perimetrale si popolerà di dozzine di aziende con piattaforme su misura per gestire modelli specifici ea vari livelli di prestazioni, buste di potenza e costi. Al contrario, il data center rimarrà il dominio delle semifinali più grandi, con NVIDIA in testa e pochi altri che seguiranno Jensen. Rivedrò questo elenco di previsioni il prossimo dicembre per vedere come ho fatto.

Di ihal