5月14日晚,在GTC 2020線上發(fā)布會(huì)上,NVIDIA干脆利落地在幾分鐘內(nèi)就放出了老黃的演講視頻,正式推出了安培(Ampere)架構(gòu)GPU,7nm工藝,540億晶體管,20倍AI算力,5大技術(shù)創(chuàng)新,總之新核彈來(lái)了。
目前NVIDIA還沒(méi)有正式公開(kāi)安培GPU的詳細(xì)架構(gòu)細(xì)節(jié),但是跟上次的圖靈GPU一樣,黃仁勛表示這是NVIDIA八代GPU史上最大的一次性能飛躍。
首款基于安培GPU的產(chǎn)品是Tesla A100加速卡,根據(jù)NVIDIA所說(shuō),它帶來(lái)了5大技術(shù)創(chuàng)新:
1、 全新安培GPU架構(gòu),540億晶體管,世界上最大的7nm處理器。
2、 第三代Tensor Core AI核心,支持TF32運(yùn)算,無(wú)需任何代碼改變就可以讓AI性能提升20倍,還支持FP64雙精度運(yùn)算,與HPC應(yīng)用相比帶來(lái)了2.5倍的性能。
3、 Multi-instance GPU多實(shí)例GPU:簡(jiǎn)稱(chēng)MIG,這是一項(xiàng)創(chuàng)新技術(shù),可以將一個(gè)GPU劃分為七個(gè)獨(dú)立的GPU,針對(duì)不同的目標(biāo)提供不同的運(yùn)算,最大化提高計(jì)算效率。
4、 NVLink 3.0:新一代GPU總線的性能翻倍,可以在服務(wù)器應(yīng)用中提供更有效的性能擴(kuò)展。
5、 結(jié)構(gòu)稀疏性:這項(xiàng)新技術(shù)利用了AI運(yùn)算中固有的稀疏性實(shí)現(xiàn)了性能翻倍。
這5大技術(shù)創(chuàng)新使得Tesla A100加速卡成為苛刻工作負(fù)載的理想選擇,不僅可以用于AI推理、AI訓(xùn)練,還可以用于科學(xué)仿真、AI對(duì)話、基因組、高性能數(shù)據(jù)分析、地震建模及財(cái)務(wù)計(jì)算等等。
與此同時(shí),NVIDIA還宣布了基于Tesla A100的DGX A100超算,有8路Tesla A100加速卡,性能高達(dá)5PFLOPS,阿里云、AWS云、谷歌云、微軟Azure、甲骨文及騰訊云都將推出基于DGX A100的云服務(wù)。
目前DGX A100發(fā)布之后就立即上市了,跟當(dāng)年的Tesla V100完全不同,美國(guó)、德國(guó)的多個(gè)實(shí)驗(yàn)室及超算中心已經(jīng)開(kāi)始使用Tesla A100作為超算解決方案了。