在法蘭克福舉辦的全球超級(jí)計(jì)算大會(huì)上,重磅消息傳來(lái),NVIDIA宣布CUDA支持Arm CPU,為高性能計(jì)算開(kāi)辟全新途徑,以構(gòu)建具有極高能效水平的百萬(wàn)兆級(jí)AI超級(jí)計(jì)算機(jī)。北京時(shí)間6月17日下午四點(diǎn),NVIDIA與媒體召開(kāi)電話會(huì)議。下文將詳解雙方合作始末,以及<電子發(fā)燒友>獨(dú)家求證后獲知的信息。
NVIDIA攜手Arm意欲何在?
隨著傳統(tǒng)計(jì)算規(guī)模擴(kuò)展步伐的停止,功率將成為所有超級(jí)計(jì)算機(jī)的限制因素。對(duì)于與Arm的攜手,NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛表示:“NVIDIA CUDA加速的計(jì)算和Arm的高能效CPU架構(gòu)的相結(jié)合,將助力HPC社區(qū)實(shí)現(xiàn)大幅提升,以達(dá)到百萬(wàn)兆級(jí)?!?br />雙方合作的原因主要有兩方面:首先,客戶需要更多選擇,一旦完成堆棧優(yōu)化,Nvidia將加速所有主要CPU架構(gòu),包括x86、Power和ARM;其次,通過(guò)將NVIDIA軟件棧引入Arm生態(tài)系統(tǒng),將進(jìn)一步助推在HPC服務(wù)器市場(chǎng)的創(chuàng)新。
年底前,NVIDIA將向Arm生態(tài)系統(tǒng)提供全堆棧的AI和HPC軟件,該堆棧為600多個(gè)HPC應(yīng)用程序和所有AI框架提供加速,其中包括了所有NVIDIA CUDA-X AI和HPC庫(kù)、GPU加速的AI框架和軟件開(kāi)發(fā)工具,如支持OpenACC的PGI編譯器和性能分析器。
NVIDIA解決方案架構(gòu)與工程團(tuán)隊(duì)副總裁Marc Hamilton透露,NVIDIA和Arm已為這個(gè)計(jì)劃準(zhǔn)備了兩年左右,認(rèn)為現(xiàn)在是最佳的發(fā)布時(shí)機(jī)。建立在雙方超過(guò)10年的合作基礎(chǔ)之上,此前,NVIDIA幾款用于便攜式游戲、自動(dòng)駕駛汽車、機(jī)器人和嵌入式AI計(jì)算的系統(tǒng)級(jí)芯片產(chǎn)品都采用了Arm。全球眾多涉及超級(jí)計(jì)算的項(xiàng)目或單位都在尋求Arm的加入,包括歐洲處理器計(jì)劃(European Processor Initiative)、日本先進(jìn)情報(bào)項(xiàng)目中心 (RIKEN)、美國(guó)能源部的先鋒項(xiàng)目(DOE Vanguard project)等。
合作僅止于HPC軟件方面?還是會(huì)進(jìn)一步影響到某些應(yīng)用市場(chǎng)?NVIDIA表示,合作同時(shí)也是對(duì)于其他平臺(tái)的補(bǔ)充,例如Jetson Xavier,并將進(jìn)一步拓展在數(shù)據(jù)中心和HPC平臺(tái)的合作。
超算競(jìng)爭(zhēng)再加劇
在超級(jí)計(jì)算機(jī)中使用基于Arm的體系結(jié)構(gòu)是值得注意的,和其他架構(gòu)相比,Arm的一大特色在于出色的能效,能夠?yàn)槌?jí)計(jì)算提供開(kāi)放式架構(gòu),用戶可以實(shí)現(xiàn)更為高度的集成。對(duì)于需要快速處理和分析大型數(shù)據(jù)集的研究密集型任務(wù),能夠滿足內(nèi)存容量和可擴(kuò)展性需求。Arm已經(jīng)在世界各地的許多HPC中心獲得了越來(lái)越多的關(guān)注,NVIDIA支持Arm CPU后,將為研發(fā)超算的研究人員們提供了除英特爾和IBM外的第三種選擇,并使得研發(fā)者可以通過(guò)這種方式獲得更多的自主控制能力。對(duì)于已經(jīng)選擇了Arm CPU的用戶來(lái)說(shuō),他們同時(shí)可以獲得NVIDIA GPU加速計(jì)算選項(xiàng)。CUDA強(qiáng)大的軟件能力,將能夠和Arm的軟件生態(tài)無(wú)縫銜接,強(qiáng)強(qiáng)聯(lián)合。
一直以來(lái),Arm并沒(méi)有放棄將其處理器擴(kuò)展至高性能計(jì)算領(lǐng)域的堅(jiān)持。近年來(lái)大的舉動(dòng)有:2016年8月宣布將與日本富士通公司合作,開(kāi)發(fā)一個(gè)以64位ARMv8-A驅(qū)動(dòng)的Post K超級(jí)計(jì)算機(jī),并于當(dāng)年12月宣布收購(gòu)Allinea Software公司,后者主要為超級(jí)計(jì)算機(jī)提供性能分析工具。在2018年11月的TOP500列表上,首次出現(xiàn)了Arm的身影,而且是安裝在大名鼎鼎的美國(guó)桑迪亞國(guó)家實(shí)驗(yàn)室。與此同時(shí),Cray于2018年11月在英國(guó)氣象局交付了一臺(tái)基于Arm的超級(jí)計(jì)算機(jī)"Isambard",而日本的下一代超級(jí)計(jì)算機(jī)"Post-K"也同樣基于Arm架構(gòu)。
超算未來(lái)將更為注重能耗
超算屆有兩個(gè)重要排名:TOP500和Green500。TOP500主要按照性能基準(zhǔn),提供通用高端應(yīng)用的系統(tǒng)排名。而相比TOP500,Green500除了追求運(yùn)算速度,更加重視超算的能耗問(wèn)題。根據(jù)今年剛剛發(fā)布的Green500排行榜,在全球最節(jié)能的25款超級(jí)計(jì)算機(jī)中,有22款都得益于NVIDIA的支持。關(guān)鍵因素在于:采用NVIDIA GPU的超級(jí)計(jì)算機(jī)能夠?qū)⒎敝氐奶幚碜鳂I(yè)卸載至更為節(jié)能的并行處理CUDA GPU之上;NVIDIA與Mellanox合作優(yōu)化整體超級(jí)計(jì)算集群的處理;以及NVIDIA發(fā)明的SXM 3D封裝和可實(shí)現(xiàn)極密集型擴(kuò)展節(jié)點(diǎn)的NVIDIA NVLink互連技術(shù)。
攜手打造超豪華“朋友圈”
包括超算中心和系統(tǒng)提供商以及系統(tǒng)級(jí)芯片制造商等在內(nèi)的眾多HPC行業(yè)及Arm生態(tài)系統(tǒng)中的全球領(lǐng)先企業(yè),都表達(dá)了其對(duì)于NVIDIA攜手Arm的支持。對(duì)于超算百萬(wàn)兆級(jí)時(shí)代的愿景,Cray認(rèn)為主要在于將AI和分析與建模、仿真相結(jié)合的系統(tǒng),這些系統(tǒng)能夠支持、也經(jīng)常需要為科學(xué)、工程和數(shù)字化轉(zhuǎn)型所需的數(shù)據(jù)密集型工作負(fù)載構(gòu)建的多種處理器架構(gòu)和系統(tǒng)。Cray系統(tǒng)管理和編程環(huán)境(編譯器、庫(kù)和工具)已經(jīng)能夠在XC和未來(lái)的Shasta超級(jí)計(jì)算機(jī)上支持Arm處理器,將CUDA和CUDA-X HPC和AI軟件堆棧用于Arm平臺(tái),并將其與Cray系統(tǒng)管理和編程環(huán)境緊密集成,能夠助力其超級(jí)計(jì)算機(jī)實(shí)現(xiàn)最終愿景。
“歐洲處理器計(jì)劃(European Processor Initiative,EPI)總經(jīng)理Philippe Notton則表示,打造歐盟自己的高端、低功耗、通用和加速器解決方案,EPI和其工業(yè)合作伙伴SiPearl非??春肗VIDIA所帶來(lái)的全新可能性。將EPI基于Arm的微處理器與NVIDIA加速器相結(jié)合,能夠匹配未來(lái)歐洲百萬(wàn)兆級(jí)模塊化超級(jí)計(jì)算機(jī)中的構(gòu)建模塊?!?br />
考慮到未來(lái)幾年內(nèi)百萬(wàn)兆級(jí)系統(tǒng)和大規(guī)模AI計(jì)算的興起,Jülich超算中心負(fù)責(zé)人Thomas Lippert表示, NVIDIA對(duì)Arm處理器的支持是非常令人興奮的發(fā)展,對(duì)于實(shí)現(xiàn)未來(lái)超級(jí)計(jì)算機(jī)和可組合數(shù)據(jù)中心的真正模塊化至關(guān)重要。
在HPC網(wǎng)絡(luò)方面處于領(lǐng)先地位的Mellanox Technologies,其InfiniBand和以太網(wǎng)技術(shù)連接了全球多款大型的超級(jí)計(jì)算機(jī),其中就包括第一代基于Arm的各系統(tǒng)。該公司創(chuàng)始人兼首席執(zhí)行官Eyal Waldman希望通過(guò)持續(xù)合作,部署200Gb/s HDR和計(jì)算網(wǎng)絡(luò)技術(shù),以優(yōu)化HPC和AI工作負(fù)載,并實(shí)現(xiàn)新一代基于Arm的超級(jí)計(jì)算機(jī)的超級(jí)連接。
百萬(wàn)兆級(jí)意義何在?
全球超級(jí)計(jì)算機(jī)競(jìng)賽正朝著“百萬(wàn)兆級(jí)計(jì)算”這個(gè)里程碑似的目標(biāo)前進(jìn)著。百萬(wàn)兆級(jí)意味著什么?一個(gè)百萬(wàn)兆級(jí)的計(jì)算機(jī)一瞬間進(jìn)行的計(jì)算量,相當(dāng)于地球上所有人每天每秒都不停地計(jì)算四年。
這種非凡的力量將使研究人員能夠進(jìn)行大規(guī)模復(fù)雜的模擬,從而在許多領(lǐng)域取得進(jìn)展,從氣候科學(xué)到基因組學(xué)、可再生能源和人工智能。田納西大學(xué)的超級(jí)計(jì)算機(jī)專家Jack Dongarra曾說(shuō)過(guò):“百萬(wàn)兆級(jí)的計(jì)算機(jī)是一項(xiàng)有力的科學(xué)工具,就像粒子對(duì)撞機(jī)或巨型望遠(yuǎn)鏡一樣?!边@些機(jī)器在工業(yè)上也很有用,它們可以被用于加速產(chǎn)品設(shè)計(jì)和識(shí)別新材料。軍方和情報(bào)機(jī)構(gòu)也渴望這樣的超級(jí)計(jì)算機(jī)能夠?qū)⒈挥糜诰S護(hù)國(guó)家安全。超級(jí)計(jì)算機(jī)是促進(jìn)科學(xué)發(fā)現(xiàn)的重要工具,建立百萬(wàn)兆級(jí)超級(jí)計(jì)算將能夠極大地?cái)U(kuò)展人類知識(shí)的邊界。
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
ARM
+關(guān)注
關(guān)注
135文章
9587瀏覽量
393513 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5682瀏覽量
110105 -
超級(jí)計(jì)算
+關(guān)注
關(guān)注
1文章
45瀏覽量
11586 -
HPC
+關(guān)注
關(guān)注
0文章
348瀏覽量
25070 -
CUDA
+關(guān)注
關(guān)注
0文章
128瀏覽量
14545
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
借助NVIDIA CUDA Tile IR后端推進(jìn)OpenAI Triton的GPU編程
NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計(jì)目標(biāo)是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的
中科曙光scaleX萬(wàn)卡超集群重塑超大規(guī)模算力基礎(chǔ)設(shè)施
在“人工智能+”行動(dòng)深入推進(jìn)的當(dāng)下,算力基礎(chǔ)設(shè)施已成為國(guó)家戰(zhàn)略競(jìng)爭(zhēng)力的核心,而超大規(guī)模集群的運(yùn)維管控難題卻日益凸顯。中科曙光scaleX萬(wàn)卡超集群打造的智能管理體系,正以“能管住-管得穩(wěn)-用得好”的進(jìn)階邏輯,重塑超大規(guī)模
如何在NVIDIA CUDA Tile中編寫(xiě)高性能矩陣乘法
本博文是系列課程的一部分,旨在幫助開(kāi)發(fā)者學(xué)習(xí) NVIDIA CUDA Tile 編程,掌握構(gòu)建高性能 GPU 內(nèi)核的方法,并以矩陣乘法作為核心示例。
在Python中借助NVIDIA CUDA Tile簡(jiǎn)化GPU編程
NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來(lái) GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用比 SIMT
NVIDIA CUDA 13.1版本的新增功能與改進(jìn)
NVIDIA CUDA 13.1 是自 CUDA 二十年前發(fā)明以來(lái),規(guī)模最大、內(nèi)容最全面的一次更新。
Arm Neoverse平臺(tái)集成NVIDIA NVLink Fusion
新聞重點(diǎn) Arm 與 NVIDIA 持續(xù)深化合作,在 AI 時(shí)代推動(dòng)協(xié)同設(shè)計(jì)與合作邁向新高度。 生態(tài)系統(tǒng)合作伙伴可將高效的 Arm 架構(gòu)計(jì)算能力集成至 NVIDIA NVLink Fu
NVIDIA在Hot Chips 2025大會(huì)展示創(chuàng)新技術(shù)
本周在加利福尼亞州帕洛阿爾托(Palo Alto)舉行的 Hot Chips 大會(huì)上,NVIDIA 專家詳細(xì)介紹了 NVIDIA NVLink 和Spectrum-X 以太網(wǎng)技術(shù)、Blackwell 以及 CUDA 如何為全球數(shù)
AI MCU#兆易創(chuàng)新GD32H7系列MCU解讀
兆易創(chuàng)新GD32H7系列MCU是中國(guó)首款基于Arm? Cortex?-M7內(nèi)核的超高性能微控制器,主打高算力與多場(chǎng)景適配能力,以下從核心特性應(yīng)用場(chǎng)景及開(kāi)發(fā)生態(tài)三方面深度解析: 一核心性能與架構(gòu)
軟通智算完成超億級(jí)A輪融資,加速AI算力產(chǎn)業(yè)布局
北京 2025年6月18日 /美通社/ -- 近日,軟通動(dòng)力旗下軟通智算科技(廣東)集團(tuán)有限公司(以下簡(jiǎn)稱"軟通智算")完成超億級(jí)A輪融資,本輪融資由盛景嘉成創(chuàng)投領(lǐng)投,廣發(fā)信德、毅達(dá)資
NVIDIA B30芯片的核心解讀
以下是關(guān)于NVIDIA B30芯片的核心解讀,綜合最新行業(yè)信息與分析: 一、 產(chǎn)品定位:中國(guó)特供的“精準(zhǔn)閹割版”? ? ? 設(shè)計(jì)目標(biāo) ? 專為中國(guó)市場(chǎng)定制,旨在規(guī)避美國(guó)出口管制(如H20芯片被禁
Arm 公司面向 PC 市場(chǎng)的 ?Arm Niva? 深度解讀
面向 PC 市場(chǎng)的 ? Arm Niva ? 深度解讀 ? Arm Niva ? 是 Arm 公司為 PC 市場(chǎng)推出的核心計(jì)算平臺(tái),屬于其“平臺(tái)優(yōu)先”戰(zhàn)略的關(guān)鍵布局。作為 ?
Arm 公司面向汽車市場(chǎng)的 ?Arm Zena? 深度解讀
面向汽車市場(chǎng)的 ? Arm Zena ? 深度解讀 Arm Zena 是 Arm 公司面向智能汽車領(lǐng)域推出的核心計(jì)算平臺(tái),屬于其“平臺(tái)優(yōu)先”戰(zhàn)略的關(guān)鍵布局。作為
NVIDIA 采用納微半導(dǎo)體開(kāi)發(fā)新一代數(shù)據(jù)中心電源架構(gòu) 800V HVDC 方案,賦能下一代AI兆瓦級(jí)算力需求
800V HVDC電源架構(gòu)開(kāi)發(fā),旗下GaNFast?氮化鎵和GeneSiC?碳化硅技術(shù)將為Kyber機(jī)架級(jí)系統(tǒng)內(nèi)的Rubin Ultra等GPU提供電力支持。 ? NVIDIA推出的下一代800V
發(fā)表于 05-23 14:59
?3333次閱讀
獨(dú)家解讀NVIDIA CUDA支持Arm——百萬(wàn)兆級(jí)超算競(jìng)爭(zhēng)再加劇?
評(píng)論