哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達官宣新一代Blackwell架構(gòu),把AI擴展到萬億參數(shù)

奇異摩爾 ? 來源:奇異摩爾 ? 2024-03-19 14:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

基于Chiplet與片間互聯(lián)技術(shù),800Gb/s RNIC,1.8TB/sNVLink,英偉達正一步步構(gòu)建出大型AI超算集群。互聯(lián)效率定義LLM效率,互聯(lián)元年正式開啟。

AI春晚GTC開幕,皮衣老黃再次燃爆全場。

時隔兩年,英偉達官宣新一代Blackwell架構(gòu),定位直指“新工業(yè)革命的引擎” ,“把AI擴展到萬億參數(shù)”。

作為架構(gòu)更新大年,本次大會亮點頗多:

宣布GPU新核彈B200,超級芯片GB200

Blackwell架構(gòu)新服務(wù)器,一個機柜頂一個超算

推出AI推理微服務(wù)NIM,要做世界AI的入口

新光刻技術(shù)cuLitho進駐臺積電,改進產(chǎn)能。
……

8年時間,AI算力已增長1000倍。

老黃斷言“加速計算到達了臨界點,通用計算已經(jīng)過時了”。

我們需要另一種方式來進行計算,這樣我們才能夠繼續(xù)擴展,這樣我們才能夠繼續(xù)降低計算成本,這樣我們才能夠繼續(xù)進行越來越多的計算。

老黃這次主題演講題目為《見證AI的變革時刻》,但不得不說,英偉達才是最大的變革本革。

GPU的形態(tài)已徹底改變

我們需要更大的GPU,如果不能更大,就把更多GPU組合在一起,變成更大的虛擬GPU。

Blackwell新架構(gòu)硬件產(chǎn)品線都圍繞這一句話展開。

通過芯片,與芯片間的連接技術(shù),一步步構(gòu)建出大型AI超算集群。

4nm制程達到瓶頸,就把兩個芯片合在一起,以10TB每秒的滿血帶寬互聯(lián),組成B200 GPU,總計包含2080億晶體管

沒錯,B100型號被跳過了,直接發(fā)布的首個GPU就是B200。

兩個超級芯片裝到主板上,成為一個Blackwell計算節(jié)點。

18個這樣的計算節(jié)點共有36CPU+72GPU,組成更大的“虛擬GPU”。

它們之間由今天宣布的NVIDIA Quantum-X800 InfiniBand和Spectrum-X800以太網(wǎng)平臺連接,可提供速度高達800Gb/s的網(wǎng)絡(luò)。

在NVLink Switch支持下,最終成為“新一代計算單元”GB200 NVL72。

一個像這樣的“計算單元”機柜,F(xiàn)P8精度的訓(xùn)練算力就高達720PFlops,直逼H100時代一個DGX SuperPod超級計算機集群(1000 PFlops)。

與相同數(shù)量的72個H100相比,GB200 NVL72對于大模型推理性能提升高達30倍,成本和能耗降低高達25倍

把GB200 NVL72當(dāng)做單個GPU使用,具有1.4EFlops的AI推理算力和30TB高速內(nèi)存。

再用Quantum InfiniBand交換機連接,配合散熱系統(tǒng)組成新一代DGX SuperPod集群。

DGX GB200 SuperPod采用新型高效液冷機架規(guī)模架構(gòu),標準配置可在FP4精度下提供11.5 Exaflops算力和240TB高速內(nèi)存。

此外還支持增加額外的機架擴展性能。

最終成為包含32000 GPU的分布式超算集群。

老黃直言,“英偉達DGX AI超級計算機,就是AI工業(yè)革命的工廠”。

將提供無與倫比的規(guī)模、可靠性,具有智能管理和全棧彈性,以確保不斷的使用。

在演講中,老黃還特別提到2016年贈送OpenAI的DGX-1,那也是史上第一次8塊GPU連在一起組成一個超級計算機。

從此之后便開啟了訓(xùn)練最大模型所需算力每6個月翻一倍的增長之路。

GPU新核彈GB200

過去,在90天內(nèi)訓(xùn)練一個1.8萬億參數(shù)的MoE架構(gòu)GPT模型,需要8000個Hopper架構(gòu)GPU,15兆瓦功率。

如今,同樣給90天時間,在Blackwell架構(gòu)下只需要2000個GPU,以及1/4的能源消耗。

在標準的1750億參數(shù)GPT-3基準測試中,GB200的性能是H100的7倍,提供的訓(xùn)練算力是H100的4倍。

Blackwell架構(gòu)除了芯片本身外,還包含多項重大革新:

第二代Transformer引擎

動態(tài)為神經(jīng)網(wǎng)絡(luò)中的每個神經(jīng)元啟用FP6和FP4精度支持。

第五代NVLink高速互聯(lián)

為每個GPU 提供了1.8TB/s雙向吞吐量,確保多達576個GPU之間的無縫高速通信

Ras Engine(可靠性、可用性和可維護性引擎)

基于AI的預(yù)防性維護來運行診斷和預(yù)測可靠性問題。

Secure AI

先進的加密計算功能,在不影響性能的情況下保護AI模型和客戶數(shù)據(jù),對于醫(yī)療保健和金融服務(wù)等隱私敏感行業(yè)至關(guān)重要。

專用解壓縮引擎

支持最新格式,加速數(shù)據(jù)庫查詢,以提供數(shù)據(jù)分析和數(shù)據(jù)科學(xué)的最高性能。

在這些技術(shù)支持下,一個GB200 NVL72就最高支持27萬億參數(shù)的模型。

而GPT-4根據(jù)泄露數(shù)據(jù),也不過只有1.7萬億參數(shù)。

英偉達要做世界AI的入口

老黃官宣ai.nvidia.com頁面,要做世界AI的入口。

任何人都可以通過易于使用的用戶界面體驗各種AI模型和應(yīng)用。

同時,企業(yè)使用這些服務(wù)在自己的平臺上創(chuàng)建和部署自定義應(yīng)用,同時保留對其知識產(chǎn)權(quán)的完全所有權(quán)和控制權(quán)。

這上面的應(yīng)用都由英偉達全新推出的AI推理微服務(wù)NIM支持,可對來自英偉達及合作伙伴的數(shù)十個AI模型進行優(yōu)化推理。

此外,英偉達自己的開發(fā)套件、軟件庫和工具包都可以作為NVIDIA CUDA-X微服務(wù)訪問,用于檢索增強生成 (RAG)、護欄、數(shù)據(jù)處理、HPC 等。

比如通過這些微服務(wù),可以輕松構(gòu)建基于大模型和向量數(shù)據(jù)庫的ChatPDF產(chǎn)品,甚至智能體Agent應(yīng)用。

3ce4fb7a-e5a1-11ee-a297-92fbcf53809c.png

NIM微服務(wù)定價非常直觀,“一個GPU一小時一美元”,或年付打五折,一個GPU一年4500美元。

從此,英偉達NIM和CUDA做為中間樞紐,連接了百萬開發(fā)者與上億GPU芯片。

什么概念?

老黃曬出AI界“最強朋友圈”,包括亞馬遜、迪士尼、三星等大型企業(yè),都已成為英偉達合作伙伴。

最后總結(jié)一下,與往年相比英偉達2024年戰(zhàn)略更聚焦AI,而且產(chǎn)品更有針對性。

比如第五代NVLink還特意為MoE架構(gòu)大模型優(yōu)化通訊瓶頸。

新的芯片和軟件服務(wù),都在不斷的強調(diào)推理算力,要進一步打開AI應(yīng)用部署市場。

當(dāng)然作為算力之王,AI并不是英偉達的全部。

這次大會上,還特別宣布了與蘋果在Vision Pro方面的合作,讓開發(fā)者在工業(yè)元宇宙里搞空間計算。

此前推出的新光刻技術(shù)cuLitho軟件庫也有了新進展,被臺積電和新思科技采用,把觸手伸向更上游的芯片制造商。

當(dāng)然也少不了生物醫(yī)療、工業(yè)元宇宙、機器人汽車的新成果。

以及布局下一輪計算變革的前沿領(lǐng)域,英偉達推出云量子計算機模擬微服務(wù),讓全球科學(xué)家都能充分利用量子計算的力量,將自己的想法變成現(xiàn)。

去年GTC大會上,老黃與OpenAI首席科學(xué)家Ilya Sutskever的爐邊對談,仍為人津津樂道。

當(dāng)時世界還沒完全從ChatGPT的震撼中清醒過來,OpenAI是整個行業(yè)絕對的主角。

如今Ilya不知蹤影,OpenAI的市場統(tǒng)治力也開始松動。在這個節(jié)骨眼上,有資格與老黃對談的人換成了8位——

Transformer八子,開山論文《Attention is all you need》的八位作者。

他們已經(jīng)悉數(shù)離開谷歌,其中一位加入OpenAI,另外7位投身AI創(chuàng)業(yè),有模型層也有應(yīng)用層,有toB也有toC。

這八位傳奇人物既象征著大模型技術(shù)真正的起源,又代表著現(xiàn)在百花齊放的AI產(chǎn)業(yè)圖景。在這樣的格局中,OpenAI不過是其中一位玩家。

而就在兩天后,老黃將把他們聚齊,在自己的主場。

要論在整個AI界的影響力、號召力,在這一刻,無論是“鋼鐵俠”馬斯克還是“奧特曼”Sam Altman,恐怕都比不過眼前這位“皮衣客”黃仁勛。




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4112

    瀏覽量

    99578
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    368

    瀏覽量

    16950
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1247

    瀏覽量

    10256
  • chiplet
    +關(guān)注

    關(guān)注

    6

    文章

    499

    瀏覽量

    13641
  • AI大模型
    +關(guān)注

    關(guān)注

    0

    文章

    402

    瀏覽量

    1038

原文標題:英偉達新核彈B200發(fā)布,一臺服務(wù)器頂一個超算,萬億參數(shù)大模型30倍推理加速

文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    英偉達5萬億市值背后,是場賭上未來的燒錢競賽

    需求下,各大云計算廠商不斷加大對AI算力基建的投資,大量購買算力卡。在10月29日的GTC大會上,英偉達CEO黃仁勛表示,公司新一代AI芯片有望在未來幾個季度創(chuàng)造高達5000億美元的收
    的頭像 發(fā)表于 11-02 11:18 ?1.1w次閱讀
    <b class='flag-5'>英偉</b>達5<b class='flag-5'>萬億</b>市值背后,是<b class='flag-5'>一</b>場賭上未來的燒錢競賽

    RV生態(tài)又里程碑:英偉達官CUDA將兼容RISC-V架構(gòu)!

    Frans?Sijstermanns宣布了則重磅消息:英偉達要將CUDA移植RISC-V架構(gòu)上。 ? 英偉達每年出貨超10億顆RISC-
    的頭像 發(fā)表于 07-19 00:04 ?6768次閱讀
    RV生態(tài)又<b class='flag-5'>一</b>里程碑:<b class='flag-5'>英偉</b><b class='flag-5'>達官</b><b class='flag-5'>宣</b>CUDA將兼容RISC-V<b class='flag-5'>架構(gòu)</b>!

    天數(shù)智芯重磅公布四架構(gòu)路線圖,對標英偉

    電子發(fā)燒友綜合報道 1月26日,天數(shù)智芯“智啟芯程”合作伙伴大會盛大啟幕。會上,天數(shù)智芯不僅公布了四架構(gòu)路線圖,還發(fā)布了“彤央”邊端產(chǎn)品,完成“云+邊+端”全場景算力布局。 ? 天數(shù)智芯AI與加速
    的頭像 發(fā)表于 01-27 16:24 ?9076次閱讀
    天數(shù)智芯重磅公布四<b class='flag-5'>代</b><b class='flag-5'>架構(gòu)</b>路線圖,對標<b class='flag-5'>英偉</b>達

    邁向吉瓦級AI工廠的能源變革:英偉達Rubin平臺電源架構(gòu)解析

    隨著人工智能(AI)模型參數(shù)量突破萬億級別,從大語言模型(LLM)的訓(xùn)練向推理、以及更高級的代理型AI(Agentic AI)演進,數(shù)據(jù)中心
    的頭像 發(fā)表于 01-15 17:42 ?924次閱讀
    邁向吉瓦級<b class='flag-5'>AI</b>工廠的能源變革:<b class='flag-5'>英偉</b>達Rubin平臺電源<b class='flag-5'>架構(gòu)</b>解析

    亞馬遜發(fā)布新一代AI芯片Trainium3,性能提升4倍

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)在拉斯維加斯舉辦的2025年亞馬遜云科技re:Invent全球大會上,亞馬遜云科技(AWS)推出新一代人工智能(AI)訓(xùn)練芯片Trainium 3,預(yù)告了下一代產(chǎn)品
    的頭像 發(fā)表于 12-09 08:37 ?8815次閱讀
    亞馬遜發(fā)布<b class='flag-5'>新一代</b><b class='flag-5'>AI</b>芯片Trainium3,性能提升4倍

    今日看點:特朗普:英偉Blackwell AI芯片不會廣泛對海外開放;閃迪 NAND 閃存11 月報價漲幅高達 50%

    是否會允許向中國出口Blackwell芯片的疑問就直不斷。當(dāng)時,特朗普曾暗示可能會允許在中國銷售英偉達下一代先進GPU芯片閹割版。然而,特朗普在空軍
    發(fā)表于 11-10 10:28 ?1372次閱讀

    【內(nèi)測活動同步開啟】這么?。窟@么強?新一代大模型MCP開發(fā)板來啦!

    【內(nèi)測活動同步開啟】這么小?這么強?新一代大模型MCP開發(fā)板來啦! 聆思全新一代六合芯片「LS26系列」,搭載WIFI / BLE & BT / NPU,與「小聆AI」強強
    發(fā)表于 09-25 11:47

    NVIDIA RTX PRO 4500 Blackwell GPU測試分析

    今天我們帶來全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測試,對比上一代產(chǎn)品 NVIDIA RTX 450
    的頭像 發(fā)表于 08-28 11:02 ?4291次閱讀
    NVIDIA RTX PRO 4500 <b class='flag-5'>Blackwell</b> GPU測試分析

    英偉達最新B30A芯片曝光:算力角逐中的新變數(shù)

    目前允許在中國銷售的H20型號。這消息瞬間點燃了行業(yè)內(nèi)外的關(guān)注熱情,為本就競爭激烈的AI芯片領(lǐng)域增添了新的變數(shù)。 ? 架構(gòu)升級:站在巨人肩膀上的革新 B30A芯片將基于英偉達去年GT
    的頭像 發(fā)表于 08-22 16:41 ?1726次閱讀

    安森美攜手英偉達推動下一代AI數(shù)據(jù)中心發(fā)展

    安森美(onsemi,美國納斯達克股票代號:ON)宣布與英偉達(NVIDIA)合作,共同推動向800V直流(VDC)供電架構(gòu)轉(zhuǎn)型。這變革性解決方案將推動下一代人工智能(
    的頭像 發(fā)表于 08-06 17:27 ?1648次閱讀

    創(chuàng)造歷史!英偉達成全球首家市值4萬億美元公司!

    7月9日,英偉達股價度飆升至163.9美元,總市值突破4萬億美元,收盤時仍達3.97萬億美元,盤后微漲站穩(wěn)4萬億,超越微軟、蘋果成全球市值
    的頭像 發(fā)表于 07-11 17:34 ?1715次閱讀
    創(chuàng)造歷史!<b class='flag-5'>英偉</b>達成全球首家市值4<b class='flag-5'>萬億</b>美元公司!

    廣和通發(fā)布新一代AI語音智能體FiboVista

    近日,2025火山引擎Force原動力大會正式開幕。廣和通發(fā)布新一代AI語音智能體FiboVista,并已率先應(yīng)用于車聯(lián)網(wǎng),成為智能駕駛的“用車伙伴”和“出行伴侶”。通過創(chuàng)新AI大模型和場景服務(wù)洞察,F(xiàn)iboVista將在智慧家
    的頭像 發(fā)表于 06-17 09:22 ?1387次閱讀

    今日看點丨英偉達將為中國市場推出新AI芯片 售價大幅低于H20;中科曙光與海光信息宣布戰(zhàn)略重組

    的H20芯片,預(yù)計最快于6月開始量產(chǎn)。報道稱,這款采用最新一代Blackwell架構(gòu)AI處理器,預(yù)計售價介于6500美元至8000美元之間,明顯低于H20的定價。較低的售價通常意味著
    發(fā)表于 05-26 11:06 ?1690次閱讀

    NVIDIA 采用納微半導(dǎo)體開發(fā)新一代數(shù)據(jù)中心電源架構(gòu) 800V HVDC 方案,賦能下一代AI兆瓦級算力需求

    全球 AI 算力基礎(chǔ)設(shè)施革新迎來關(guān)鍵進展。近日,納微半導(dǎo)體(Navitas Semiconductor, 納斯達克代碼:NVTS)宣布參與NVIDIA 英偉達(納斯達克股票代碼: NVDA) 下一代
    發(fā)表于 05-23 14:59 ?3318次閱讀
    NVIDIA 采用納微半導(dǎo)體開發(fā)<b class='flag-5'>新一代</b>數(shù)據(jù)中心電源<b class='flag-5'>架構(gòu)</b> 800V HVDC 方案,賦能下<b class='flag-5'>一代</b><b class='flag-5'>AI</b>兆瓦級算力需求

    英偉達Q3將發(fā)布新一代人工智能系統(tǒng)

    的電氣機械,但是確是全面升級的,GB300 升級到了 Grace Blackwell Ultra 架構(gòu),而且推理性能、HBM 內(nèi)存容量、網(wǎng)絡(luò)性能都有大幅提升。
    的頭像 發(fā)表于 05-19 18:02 ?740次閱讀
    华容县| 五指山市| 竹溪县| 桃江县| 湖北省| 浦江县| 社会| 宣武区| 类乌齐县| 合江县| 葫芦岛市| 万全县| 汉源县| 芜湖县| 台北县| 随州市| 垣曲县| 海丰县| 察哈| 鱼台县| 东乡族自治县| 镇赉县| 荥经县| 灵寿县| 龙南县| 安多县| 鸡西市| 涟源市| 温宿县| 河间市| 惠安县| 沙洋县| 林芝县| 双江| 新沂市| 宜阳县| 余庆县| 平谷区| 桦川县| 闽侯县| 四会市|