原標(biāo)題:世界最新top500超計算排行榜出爐了! 暴露英偉達(dá)雄霸三分之二版圖的擴(kuò)張之路! 資料來源:墨記
6月22日,在國際超計算大會( isc )期間,發(fā)表了最新的top500超級計算機(jī)排名。 這個排名顯示了世界現(xiàn)代科學(xué)計算的整體情況,引人注目的是前10位的超級計算機(jī)中有8臺使用nvidia技術(shù)的top500排行榜的全部系統(tǒng)中,有三分之二的系統(tǒng)( 333套)是nvidia
除了當(dāng)前產(chǎn)品和技術(shù)水平的廣泛復(fù)蓋外,nvidia還在推動數(shù)據(jù)觀察、模擬、可視化、邊緣流、ai和云技術(shù)的應(yīng)用,以應(yīng)對當(dāng)前和將來的挑戰(zhàn)。 英偉達(dá)超越江湖地位再次更新
top500排行榜每年更新兩次。 根據(jù)這個最新排名,世界排名前十位的超級計算機(jī)中有八臺使用nvidiagpu、infiniband互聯(lián)網(wǎng)技術(shù)或兩種技術(shù)。 這包括美國、歐洲和中國最強(qiáng)大的超級計算機(jī)系統(tǒng)。
在top500排行榜的所有系統(tǒng)中,三分之二的系統(tǒng)( 333套)使用nvidia (包括收購的mellanox )增強(qiáng)力量。 在2005年6月公布的排行榜中,使用兩個企業(yè)的系統(tǒng)比例合計不足一半( 203套)。
目前,約四分之三( 3(74% )的新infiniband系統(tǒng)使用nvidiamellanoxhdr 200 ginfiniband,標(biāo)志著這種智能高速數(shù)據(jù)互聯(lián)技術(shù)的迅速普及。 自2019年11月以來,采用hdr infiniband的top500系統(tǒng)的數(shù)量幾乎增加了一倍。 141臺超級計算機(jī)采用infiniband,自2019年6月以來增加了12%。
在top500超級計算機(jī)中,305臺系統(tǒng)采用nvidia mellanox infiniband和以太網(wǎng)( 61% ),所有141臺infiniband系統(tǒng)和164臺( 63% )以太網(wǎng)
更多的top500系統(tǒng)使用nvidia gpu、mellanox互聯(lián)網(wǎng)技術(shù)
或者用了這兩種技術(shù)。
top500排名前25的超級計算機(jī)中有20臺系統(tǒng)選擇使用nvidia gpu。 為什么? 能源效率是第一個原因。 如下圖所示,采用nvidia gpu的系統(tǒng)與不使用nvidia gpu的系統(tǒng)相比,能效( gigaflops/watt單位)平均高2.8倍。
四周構(gòu)建頂級超級計算機(jī),每秒100億次ai計算能力!
top500和green500排行榜的主要參考依據(jù)之一是linpack benchmark的性能標(biāo)準(zhǔn)。 在計算系統(tǒng)中,每瓦性能( gfloat/watts )是測量特定計算機(jī)體系結(jié)構(gòu)或計算機(jī)硬件能效的度量。 實(shí)際上,它測量了計算機(jī)每單位功耗可以消耗的計算速度。 另外,green500比top500更重視計算速度,還重視超計算的能源消耗問題。
nvidia內(nèi)部研究集群的新成員selene能夠充分說明nvidia gpu的能效表現(xiàn)。 在linpack基準(zhǔn)測試中,selene以27.5petaflops的性能,在最新的green500排行榜上排名第二,在top500排行榜上排名第七。
selene的耗電量為20.5 gigaflops/watt,與green500排行榜的第一名的差距很小,但第一名的系統(tǒng)體積很小,其性能表現(xiàn)僅為第394名。
也就是說,selene是前100名系統(tǒng)中唯一突破20 gigaflops/watt能效的系統(tǒng),是世界上性能第二的產(chǎn)業(yè)用超級計算機(jī),是意大利能源巨頭eni s.p.a .的no. 6系統(tǒng)
在能效方面,selene的能效是其他不使用nvidia gpu的top500系統(tǒng)的平均能效性能的6.8倍。
nvidia加速計算產(chǎn)品管理總監(jiān)paresh kharya表示,除了能效性能外,selene的另一個精彩之處是在不到4周內(nèi)構(gòu)建的系統(tǒng),每套14個 selene是280臺dgx a100系統(tǒng)、2240臺nvidia a100 gpu、494臺nvidiamellanoxquantum 200 Ginfiniband交換機(jī)、56 tb/s互聯(lián)網(wǎng)體系結(jié)構(gòu)、7pb高性能
selene最重要的性能規(guī)格之一是可以提供超過1 exaflops的ai性能。 此外,tpcx-bb的重要數(shù)據(jù)觀察基準(zhǔn)僅采用16臺dgx a100系統(tǒng)即可記錄新記錄,性能是其他系統(tǒng)的20倍。
現(xiàn)在ai和分解是科學(xué)計算中的新訴求。 因?yàn)檫@些結(jié)果也特別重要。 在世界各地,研究者利用深入的學(xué)習(xí)和數(shù)據(jù)觀察來預(yù)測各種最有潛力的行業(yè),并進(jìn)行實(shí)驗(yàn)。 這種方法有助于研究者減少昂貴、耗時的實(shí)驗(yàn)量,加快取得科學(xué)成果的速度。
按a100HPC和ai融合的快進(jìn)按鈕
通過將gpu設(shè)為“大”,a100就像大型反應(yīng)堆。 從年的p100到年的a100,性能提高了9倍以上。 黃仁勛上個月從自家烤箱里拿出的“世界上最大的顯卡”dgx a100是杰作之一,最新發(fā)表的selene進(jìn)一步論證了其“恐怖”。
根據(jù)今年gtc上黃仁勛的發(fā)布,a100tensor core的一大創(chuàng)新點(diǎn)是引入fp32動態(tài)范圍和fp16精度相結(jié)合的tensorfloat-32(tf32 )來加速fp32的運(yùn)算。 據(jù)說在hpc的線性動力學(xué)場景中性能提高了4倍,在單精度訓(xùn)練中性能提高了5倍。 總之,第三代tensor core的核心可以為以前傳遞的64位數(shù)學(xué)模擬和精度較低的ai業(yè)務(wù)提供加速。
hpc和ai的融合,nvidia按下快進(jìn)按鈕,ai、數(shù)據(jù)科學(xué)和科學(xué)計算融合的新時代似乎開始風(fēng)靡一時。
目前,世界一流的供應(yīng)商有華碩、atos、思科、dell technologies、富士通、技嘉技術(shù)、hpe、浪潮、聯(lián)想、one stop systems、quanta/qct、SuperCiment
這些服務(wù)的發(fā)售時期各不相同,今年夏天將發(fā)售30種系統(tǒng),預(yù)計年底前將發(fā)售20種以上的系統(tǒng)。
據(jù)悉,此次top500排行榜中現(xiàn)在沒有出現(xiàn)的6臺建設(shè)中系統(tǒng)也使用了a100 gpu。 結(jié)合硬件和軟件制作大數(shù)據(jù),觀察新的基準(zhǔn)
現(xiàn)在大企業(yè)采用ai獲得生產(chǎn)力和先進(jìn)的洞察。
tpcx-bb是企業(yè)用于實(shí)際etl (提取、轉(zhuǎn)換、加載)和機(jī)器學(xué)習(xí)業(yè)務(wù)流程的大數(shù)據(jù)標(biāo)準(zhǔn)測試。 該基準(zhǔn)的30個查詢項目包括各種大型數(shù)據(jù)觀察用例,包括庫存管理、價格分解、銷售分解、推薦系統(tǒng)、客戶細(xì)分和情感分解。
迄今為止,該基準(zhǔn)僅在cpu系統(tǒng)上運(yùn)行。 分布式計算系統(tǒng)正在穩(wěn)步改善,但執(zhí)行這樣大的數(shù)據(jù)業(yè)務(wù)負(fù)載存在瓶頸。 nvidia通過rapids軟件生態(tài)系統(tǒng)和dgx a100系統(tǒng),以19.5倍的tpcx-bb性能打破記錄,確立了大數(shù)據(jù)觀察的新標(biāo)桿。
該基準(zhǔn)測試使用rapids開源數(shù)據(jù)科學(xué)軟件庫工具包,采用由16臺nvidia dgx a100系統(tǒng)組成的群集,nvidia在14.5分鐘內(nèi)完成了基準(zhǔn)測試,迄今為止,cpu系統(tǒng) 該dgx a100集群系統(tǒng)總共構(gòu)成128個nvidia a100 gpu,配備了nvidia mellanox互聯(lián)網(wǎng)功能。 這個硬件和軟件相結(jié)合的系統(tǒng)可以加快計算、通信、互聯(lián)網(wǎng)和存儲基礎(chǔ)架構(gòu)。
30個tpcx bb基準(zhǔn)的查詢結(jié)果
rapids在16個dgx a100系統(tǒng)上運(yùn)行,為每個10tb測試查詢提供上述相對性能提高。 與以前上傳和采用cpu的方案相比,rapids和dgx a100系統(tǒng)的價格是1/7,功耗是1/3。
此外,nvidia與開源社區(qū)合作,為apache spark 3.0帶來了端到端gpu加速,支持重要而耗時的機(jī)器學(xué)習(xí)解決方案前端。
ai模型培訓(xùn)可以在同一spark群集上解決業(yè)務(wù)負(fù)載,而不是作為單獨(dú)的進(jìn)程在單獨(dú)的基礎(chǔ)架構(gòu)上運(yùn)行。 這樣,可以高性能地觀察整個數(shù)據(jù)科學(xué)解決過程,從數(shù)據(jù)湖迅速制作與模型訓(xùn)練相關(guān)的數(shù)十甚至數(shù)千tb的數(shù)據(jù)。 此外,無需更改應(yīng)用于本地和云spark應(yīng)用程序的現(xiàn)有代碼。
收購mellanox得到的增益大幅度浮現(xiàn)
nvidia在超算這一尖端行業(yè)攻城掠奪地的大規(guī)模擴(kuò)張也與mellanox的貢獻(xiàn)密切相關(guān),重新驗(yàn)證了這一收購的戰(zhàn)術(shù)觀點(diǎn)。 產(chǎn)品線與nvidia互補(bǔ),憑借mellanox的infiniband、以太網(wǎng)等技術(shù),nvidia具有更強(qiáng)的互聯(lián)網(wǎng)服務(wù)和云功能,形成了更強(qiáng)大的整體處理能力。
根據(jù)這次top500的排名,infiniband是排名前十的超級計算機(jī)中的7臺高速化,包括中國、歐洲和美國性能最高的系統(tǒng)。
我知道infiniband的設(shè)計是基于四個基本的基礎(chǔ)。 是可以運(yùn)行所有互聯(lián)網(wǎng)引擎的智能端點(diǎn)設(shè)計。 擴(kuò)展設(shè)計的軟件定義交換互聯(lián)網(wǎng)一站式控制和操作的集中管理開放源代碼技術(shù)和開放api是確保和支持正向和反向兼容性的標(biāo)準(zhǔn)技術(shù)。
這些基本上有助于infiniband實(shí)現(xiàn)高互聯(lián)網(wǎng)性能、低延遲、高速新聞收發(fā)。 作為目前市場上唯一的200gb/s高速互聯(lián)產(chǎn)品,infiniband通過端到端自適應(yīng)路由、擁塞控制和服務(wù)質(zhì)量提供了高互聯(lián)網(wǎng)效率。
除了高效的互聯(lián)網(wǎng)外,我們也不能忽視數(shù)據(jù)中心停機(jī)造成的價格損失。 根據(jù)itic的研究,一小時停止造成的價格損失一般在30萬美元以上。 nvidia推出了最新的ufm cyber-ai平臺,以最大限度地減少數(shù)據(jù)中心停機(jī)造成的損失。 ufm平臺產(chǎn)品系列對infiniband系統(tǒng)進(jìn)行了近十年的管理,此次擴(kuò)展使用ai從實(shí)時和歷史的遙測和業(yè)務(wù)負(fù)荷數(shù)據(jù)中學(xué)習(xí)數(shù)據(jù)中心的運(yùn)營節(jié)奏和互聯(lián)網(wǎng)的業(yè)務(wù)負(fù)荷模型 因此,根據(jù)此標(biāo)準(zhǔn)跟蹤系統(tǒng)運(yùn)行狀況和互聯(lián)網(wǎng)篡改,檢測性能下降、招聘狀況和配置文件更改。
nvidia mellanox互聯(lián)網(wǎng)事業(yè)部高級營銷副總裁gilad shainer表示,該平臺明確了數(shù)據(jù)中心的獨(dú)特生命體征,降低了性能、組件故障和異常招聘方式
infiniband成為氣候研究和天氣預(yù)報應(yīng)用的實(shí)際標(biāo)準(zhǔn)。 世界多個氣象服務(wù)機(jī)構(gòu)選擇nvidia mellanox infiniband互聯(lián)網(wǎng),以加速西班牙氣象局、中國氣象局、芬蘭氣象局、nasa、荷蘭皇家氣象局等超級計算平臺
北京市氣象臺選擇了200千兆位HDR InfiniBand互聯(lián)技術(shù),加快了超級計算平臺。 這個平臺用于增強(qiáng)天氣預(yù)報,改善氣候和環(huán)境研究,2022年北京冬季奧運(yùn)會的天氣預(yù)報。
氣象模型和氣候模型是計算和數(shù)據(jù)密集型模型,因此預(yù)測質(zhì)量一般取決于模型的多少、復(fù)雜性和高分辨率,分辨率取決于超級計算機(jī)的性能,超級計算機(jī)的性能是互聯(lián)技術(shù)在計算資源之間迅速有效地同時擴(kuò)展
天氣預(yù)報已成為超計算改變的新行業(yè)。 nvidia a100 gpu和mellanox hdr infiniband互聯(lián)網(wǎng)技術(shù)帶來的超計算風(fēng)暴不止這些。 正在重新定義加速計算
因?yàn)橐咔椋衲甑某愦髸ovid-19相關(guān)技術(shù)和方案也越來越重視。
nvidia科學(xué)計算平臺所起的作用也給加速計算的未來帶來了越來越多的可能性。 從數(shù)據(jù)觀察到模擬和可視化、ai和邊緣解決,平臺加快了所有行業(yè)的方法。
ai .數(shù)據(jù)觀察和邊緣流重新定義了科學(xué)計算。 隨著深入學(xué)習(xí)和解體的擴(kuò)展,科學(xué)家們運(yùn)用云計算服務(wù),也運(yùn)用來自互聯(lián)網(wǎng)邊緣的遠(yuǎn)程設(shè)備的流數(shù)據(jù),這些要素共同構(gòu)成了nvidia加速的科學(xué)計算支柱。
加上前面文章多的一點(diǎn)進(jìn)展,一些前沿的例子值得關(guān)注和思考。
在仿真中,在對抗新型冠狀病毒的過程中,橡樹國家實(shí)驗(yàn)室( oak ridge national laboratory )的研究者使用summit超級計算機(jī)的內(nèi)置gpu執(zhí)行autodock,全年無休,20億種
在科學(xué)的邊緣流中,歐洲核研究所( cern )最近宣布,nvidia gpu將把大型強(qiáng)子對撞機(jī)內(nèi)粒子對撞機(jī)事件產(chǎn)生的數(shù)據(jù)量減少500倍。
在可視化中,nvidia的index和magnum io軟件有助于增強(qiáng)火星注冊者號碼的可視化功能,這是世界上最大規(guī)模的交互式實(shí)時立體可視化項目。
nvidia方面說,最新的top500排行榜以另一種形式證明了nvidia為實(shí)現(xiàn)ai和hpc民主化所做的努力。 研究者和公司都強(qiáng)烈要求加快從云到互聯(lián)網(wǎng)邊緣的ai和分解。
為科學(xué)計算提供端到端業(yè)務(wù)流程,采用完全創(chuàng)新戰(zhàn)略,加快所有重要的應(yīng)用行業(yè),是nvidia加快計算行業(yè)兩大成功的秘訣。
本文由電子發(fā)燒友網(wǎng)原創(chuàng),未經(jīng)許可禁止轉(zhuǎn)載。 需要轉(zhuǎn)載時,請追加微信號elecfans999
全天候滾動播放最新的財經(jīng)信息和視頻,越來越多的粉絲福利掃描二維碼備受關(guān)注( finance )。
標(biāo)題:【熱門】全球最新TOP500超算榜單出爐!揭秘英偉達(dá)雄霸三分之二版圖的擴(kuò)張之路
地址:http://m.swled.com.cn/gphq/2671.html