6月12日,國(guó)際TOP500組織(Top500.org)正式發(fā)布第65期全球超級(jí)計(jì)算機(jī)500強(qiáng)榜單,AMD處理器驅(qū)動(dòng)的超級(jí)計(jì)算機(jī)首次包攬榜單前兩位,成為最大贏家。但英特爾仍以294套系統(tǒng)的絕對(duì)優(yōu)勢(shì)保持整體市占率第一,全球超算市場(chǎng)呈現(xiàn)“雙雄爭(zhēng)霸”新格局。
AMD實(shí)現(xiàn)歷史性突破,前兩名首次易主
根據(jù)榜單數(shù)據(jù),“埃爾卡皮坦” (El Capitan)系統(tǒng)在HPL基準(zhǔn)測(cè)試中以1.742EFlop/s的峰值算力位居第一。該超算位于美國(guó)加州勞倫斯利弗莫爾國(guó)家實(shí)驗(yàn)室Lawrence Livermore National Laboratory),基于 AMD 第四代 EPYC處理器(24 核,1.8 GHz)和 AMD Instinct MI300A 加速器,擁有 11,039616 個(gè)計(jì)算核心,運(yùn)行于HPE Cray EX255a 架構(gòu)下,并使用HPE Slingshot 網(wǎng)路互連技術(shù),能效達(dá)到58.9 Gigaflop/瓦。該系統(tǒng)在 HPCG 基準(zhǔn)測(cè)試(旨在評(píng)估高性能計(jì)算系統(tǒng)在解決線性方程組問題時(shí)的性能表現(xiàn))中的測(cè)算速度也達(dá)到了17.41Petaflop/s。
緊隨其后的是田納西州橡樹嶺國(guó)家實(shí)驗(yàn)室(Oak Ridge National Laboratory)的“前沿”(Frontier) 系統(tǒng)超級(jí)計(jì)算機(jī),采用的是 HPE Cray EX235a架構(gòu),配備 AMD 第三代 EPYC 64 核 2GHz 處理器和AMD Instinct 250X GPU。共有8699904個(gè)CPU和GPU核心,并同樣借助于HPE Slingshot 11網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)傳輸,Rmax 性能為 1.353 ExaFLOPS。
TOP10的其余排名如下:
第三名,“極光”(Aurora)系統(tǒng)以1.012EFlop/s的HPL性能排名第三。該超算安裝在美國(guó)伊利諾伊州的阿貢國(guó)家實(shí)驗(yàn)室(Argonne Leadership Computing Facility),也是由美國(guó)能源部(DOE)運(yùn)營(yíng)。Aurora 基于HPE Cray EX網(wǎng)絡(luò)和Slingshot 互連技術(shù),整合了21248個(gè)Intel Xeon Max系列CPU、63744個(gè)Intel Max系列GPU、20.42PB內(nèi)存。
第四名,“木星增強(qiáng)器”(JUPITER Booster) 系統(tǒng)以793.4PFlop/s的HPL性能排名第四。該系統(tǒng)安裝在德國(guó)于利希的超級(jí)計(jì)算中心(EuroHPC/Jülich Supercomputing Centre),由于利希超級(jí)計(jì)算中心運(yùn)營(yíng)。它基于 Eviden 的 BullSequana XH3000 直接液冷架構(gòu),并采用NVIDIA Grace Hopper 超級(jí)芯片。目前,該系統(tǒng)僅部分投入了運(yùn)行,因此該性能并非完全性能。
第五名,“鷹” 系統(tǒng)(Eagle)以561PFlop/s的HPL性能排名第五。該超算安裝在微軟Azure云平臺(tái)上,并且它依然是Top500超算中最高排名的云計(jì)算系統(tǒng)。這款微軟NDv5系統(tǒng)的強(qiáng)大性能,源于英特爾Xeon Platinum 8480C處理器和英偉達(dá)(NVIDIA) H100 GPU加速器的結(jié)合。
第六名,HPC6 系統(tǒng)以477.9PFlop/s的HPL性能排名第六。該超算安裝在意大利費(fèi)雷拉埃爾博尼奧內(nèi)的埃尼公司(Eni SpA)中心,基于HPE Cray EX235a系統(tǒng),整合了針對(duì)HPC和AI優(yōu)化的第三代AMD EPYC CPU,并配備AMD Instinct 250X加速器和HPE Slingshot互聯(lián)技術(shù)。
第七名,“富岳” 系統(tǒng)(Fugaku)憑借其442PFlop/s的HPL性能排名第七。該超算安裝在日本神戶的理研計(jì)算科學(xué)研究中心(R-CCS),基于 2.2GHz Fujitsu A64FX 48C處理器,Tofu interconnect D互聯(lián),共計(jì)擁有7630848個(gè)核心。此外,該超算還以 16 Teraflop/s 的性能成為 HPCG 基準(zhǔn)測(cè)試中速度第二快的系統(tǒng)。
第八名,“阿爾卑斯”(Alps) 系統(tǒng)憑借434.9PFlop/s的HPL性能排名第八。該超算位于瑞士國(guó)家超級(jí)計(jì)算中心 (CSCS) ,采用 HPE Cray EX254n 系統(tǒng),配備英偉達(dá)Grace 72C和英偉達(dá)GH200超級(jí)芯片以及 Slingshot 互連技術(shù)。
第九名,LUMI 系統(tǒng)以380PFlop/s的HPL性能排名第九。該超算安裝在芬蘭 CSC 的 歐洲高性能計(jì)算中心(EuroHPC),基于HPE Cray EX235a系統(tǒng),AMD第三代EPYC 64C 2GHz處理器,AMD Instinct MI250X加速器,Slingshot-11網(wǎng)絡(luò)。
第十名,“萊昂納多” (Leonardo)系統(tǒng)以241.2Petaflop/s的HPL性能排名第十。該超算安裝在意大利CINECA。它是一套Atos BullSequana XH2000系統(tǒng),處理器為英特爾Xeon Platinum 8358 32C 2.6GHz,并配備了英偉達(dá)A100 SXM4 40 GB,互連接口為四軌英偉達(dá)HDR100 Infiniband。
AMD占前十半壁江山,英特爾仍主導(dǎo)整體市場(chǎng)
在榜單前十名中,AMD和英特爾處理器是排名前十的系統(tǒng)的首選。其中四個(gè)系統(tǒng)使用 AMD 處理器(El Capitan、Frontier、HPC6 和 LUMI),三個(gè)系統(tǒng)使用英特爾處理器(Aurora、Eagle、Leonardo)。
Alps 和 JUPITER Booster 依靠英偉達(dá)Grace Hopper超級(jí)芯片,而Fugaku 則繼續(xù)使用基于ARM的富士通專有A64FX處理器。排名前十的計(jì)算機(jī)中有七臺(tái)(El Capitan、Frontier、Aurora、HPC6、Alps、LUMI 和 JUPITER Booster)使用了Slingshot互連技術(shù),另外兩臺(tái)(Eagle 和 Leonardo)使用了Infiniband互連技術(shù)。Fugaku保留了其專有的Tofu互連技術(shù)。
盡管在頭部系統(tǒng)競(jìng)爭(zhēng)中落后,英特爾仍以294套系統(tǒng)的數(shù)量保持整體市占率第一(58.8%),但較2023年11月的322套減少28套,延續(xù)近年下降趨勢(shì)。AMD則以173套系統(tǒng)(34.6%)緊隨其后,較上期增加32套,兩者差距持續(xù)縮小。
榜單顯示,全球超算正加速向異構(gòu)計(jì)算轉(zhuǎn)型,AMD在GPU加速領(lǐng)域的優(yōu)勢(shì)助力其快速崛起。基于英偉達(dá)處理器的系統(tǒng)目前在榜單上出現(xiàn)了13 臺(tái),另有9 臺(tái)系統(tǒng)使用其他Arm 架構(gòu)CPU,還有6 臺(tái)使用IBM Power9 或中國(guó)的Sunway 架構(gòu)等其他處理器。
中國(guó)不再更新,總上榜數(shù)仍居第二
雖然中國(guó)和美國(guó)再次成為TOP500榜單上參賽數(shù)量最多的國(guó)家,但中國(guó)超算由于不再參與該HPL基準(zhǔn)測(cè)試的數(shù)據(jù)更新,沒有系統(tǒng)進(jìn)入前十,目前神威太湖之光排名跌至第21名,天河2A則跌至了第31名。
美國(guó)新增兩臺(tái)系統(tǒng),使其參賽系統(tǒng)總數(shù)達(dá)到173臺(tái)。前三名的超級(jí)計(jì)算機(jī)均由美國(guó)能源部實(shí)驗(yàn)室運(yùn)營(yíng),均屬于百億億次(Exascale)級(jí)系統(tǒng)。
中國(guó)與上一屆榜單一樣,沒有新增任何系統(tǒng),整體上榜數(shù)量有所下降,從上一屆的63臺(tái)減少到46臺(tái)。德國(guó)繼續(xù)縮小差距,目前有43臺(tái)系統(tǒng)上榜,位列第三。
按大洲劃分,北美以187臺(tái)系統(tǒng)位居榜首,其次是歐洲(163臺(tái)),亞洲(135臺(tái))。
異構(gòu)計(jì)算與能效比成關(guān)鍵
榜單分析指出,全球超算正呈現(xiàn)三大趨勢(shì):
異構(gòu)架構(gòu)普及:前十大系統(tǒng)均采用CPU+GPU/加速器架構(gòu),AMD MI250X與NVIDIA A100/H100加速卡成為主流配置。
能效比競(jìng)爭(zhēng)加劇:新晉榜單的日本“富岳”系統(tǒng)以28.3 GFlops/W能效比領(lǐng)跑綠色超算榜單,較上期提升12%。
量子計(jì)算融合:德國(guó)于利希研究中心的JUPITER系統(tǒng)首次集成量子計(jì)算模塊,探索混合架構(gòu)新路徑。
TOP500榜單編輯杰克·唐加拉(Jack Dongarra)表示:“AMD的突破不僅是產(chǎn)品成功,更體現(xiàn)HPC領(lǐng)域?qū)δ苄АU(kuò)展性和異構(gòu)計(jì)算整合能力的綜合要求。隨著E級(jí)超算時(shí)代來臨,單一廠商壟斷格局已被打破。”
全球超算競(jìng)爭(zhēng)已進(jìn)入多極化新階段,AMD與英特爾的博弈將持續(xù)重塑HPC產(chǎn)業(yè)生態(tài),而中國(guó)超算在自主架構(gòu)領(lǐng)域的深耕,則為全球技術(shù)多元化發(fā)展提供重要支撐。