哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Blackwell白皮書:NVIDIA Blackwell Architecture Technical Brief

向上 ? 2025-03-20 18:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA Blackwell 架構(gòu)為生成式 AI加速計(jì)算帶來(lái)的突破性進(jìn)步。Blackwell 基于多代** NVIDIA 技術(shù)構(gòu)建,以出眾的性能、效率和規(guī)模揭開(kāi)了生成式 AI 領(lǐng)域的新篇章。

NVIDIA Blackwell Architecture Technical Brief免費(fèi)下載
*附件:NVIDIA Blackwell Architecture Technical Brief.doc

新型 AI 超級(jí)芯片

Blackwell 架構(gòu) GPU 具有 2080 億個(gè)晶體管,采用專門定制的臺(tái)積電 4NP 工藝制造。所有 Blackwell 產(chǎn)品均采用雙倍光刻極限尺寸的裸片,通過(guò) 10 TB/s 的片間互聯(lián)技術(shù)連接成一塊統(tǒng)一的 GPU。

第二代 Transformer 引擎

第二代 Transformer 引擎將定制的 Blackwell Tensor Core技術(shù)與 NVIDIA? TensorRT? -LLM 和 NeMo? 框架創(chuàng)新相結(jié)合,加速大語(yǔ)言模型 (LLM) 和專家混合模型 (MoE) 的推理和訓(xùn)練。

為了強(qiáng)效助力 MoE 模型的推理 Blackwell Tensor Core增加了新的精度 (包括新的社區(qū)定義的微縮放格式),可提供較高的準(zhǔn)確性并輕松替換更大的精度。Blackwell Transformer 引擎利用稱為微張量縮放的細(xì)粒度縮放技術(shù),優(yōu)化性能和準(zhǔn)確性,支持 4 位浮點(diǎn) (FP4) AI。這將內(nèi)存可以支持的新一代模型的性能和大小翻倍,同時(shí)保持高精度。

安全 AI

Blackwell 內(nèi)置 NVIDIA 機(jī)密計(jì)算技術(shù),可通過(guò)基于硬件的強(qiáng)大安全性保護(hù)敏感數(shù)據(jù)和 AI 模型,使其免遭未經(jīng)授權(quán)的訪問(wèn)。Blackwell 是業(yè)內(nèi)首款具備可信執(zhí)行環(huán)境 (TEE) I/O 功能的 GPU,它不僅能夠與具備 TEE-I/O 功能的主機(jī)一同提供性能卓越的機(jī)密計(jì)算解決方案,還能通過(guò) NVIDIA? NVLink? 技術(shù)提供實(shí)時(shí)保護(hù)。與未加密模式相比, Blackwell 機(jī)密計(jì)算功能供了幾乎相同的吞吐量性能?,F(xiàn)在,除了保護(hù) AI 知識(shí)產(chǎn)權(quán) (IP) 和安全地實(shí)現(xiàn)機(jī)密 AI 訓(xùn)練、推理和聯(lián)邦學(xué)習(xí),企業(yè)甚至還能以高性能的方式保護(hù)最大的模型。

NVLink、NVSwitch 和 NVLink Switch 系統(tǒng)

是否能釋放百億億級(jí)計(jì)算和萬(wàn)億參數(shù) AI 模型的全部潛力取決于服務(wù)器集群中每個(gè) GPU 之間能否快速、順暢的通信。第五代 NVIDIA? NVLink? 可擴(kuò)展至 576 個(gè) GPU,為萬(wàn)億和數(shù)萬(wàn)億參數(shù) AI 模型釋放加速性能。

NVIDIA NVLink 交換機(jī)芯片可在一個(gè)有 72 個(gè) GPU 的 NVLink 域 (NVL72) 中實(shí)現(xiàn) 130TB/s 的 GPU 帶寬,并通過(guò) NVIDIA SHARP? 技術(shù)對(duì) FP8 的支持實(shí)現(xiàn) 4 倍于原來(lái)的帶寬效率。NVIDIA NVLink 交換機(jī)芯片能以驚人的 1.8TB/s 互連速度為多服務(wù)器集群提供支持。采用 NVLink 的多服務(wù)器集群可以在計(jì)算量增加的情況下同步擴(kuò)展 GPU 通信,因此 NVL72 可支持的 GPU 吞吐量是單個(gè) 8 卡 GPU 系統(tǒng)的 9 倍。

解壓縮引擎

過(guò)去,數(shù)據(jù)分析和數(shù)據(jù)庫(kù)工作流依賴 CPU 進(jìn)行計(jì)算。加速數(shù)據(jù)科學(xué)可以顯著提高端到端分析性能,加速價(jià)值創(chuàng)造,同時(shí)降低成本。Apache Spark 等數(shù)據(jù)庫(kù)在接手、處理和分析大量數(shù)據(jù)等數(shù)據(jù)分析工作上發(fā)揮著關(guān)鍵作用。

Blackwell 擁有的解壓縮引擎以及通過(guò) 900GB/s 雙向帶寬的高速鏈路訪問(wèn) NVIDIA Grace? CPU 中大量?jī)?nèi)存的能力,可加速整個(gè)數(shù)據(jù)庫(kù)查詢工作流,從而在數(shù)據(jù)分析和數(shù)據(jù)科學(xué)方面實(shí)現(xiàn)更高性能。Blackwell 支持 LZ4、Snappy 和 Deflate 等最新壓縮格式。

可靠性、可用性和可服務(wù)性 (RAS) 引擎

Blackwell 通過(guò)專用的可靠性、可用性和可服務(wù)性 (RAS) 引擎增加了智能恢復(fù)能力,以識(shí)別早期可能發(fā)生的潛在故障,從而更大限度地減少停機(jī)時(shí)間。NVIDIA AI 驅(qū)動(dòng)的預(yù)測(cè)管理功能持續(xù)監(jiān)控硬件和軟件中數(shù)千個(gè)數(shù)據(jù)點(diǎn)的整體運(yùn)行狀況,以預(yù)測(cè)和攔截停機(jī)時(shí)間和低效的來(lái)源。這建立了智能可靠性技術(shù),節(jié)省時(shí)間、能源和計(jì)算成本。

NVIDIA 的 RAS 引擎提供深入的診斷信息,可以識(shí)別關(guān)注領(lǐng)域并制定維護(hù)計(jì)劃。RAS 引擎通過(guò)快速定位問(wèn)題來(lái)源縮短周轉(zhuǎn)時(shí)間,并通過(guò)促進(jìn)有效的補(bǔ)救最大限度地減少停機(jī)時(shí)間。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5678

    瀏覽量

    110073
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試

    越來(lái)越多的應(yīng)用正在使用 AI 加速,而無(wú)論工作站的大小或形態(tài)如何,都有越來(lái)越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的頭像 發(fā)表于 11-28 09:39 ?6875次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 <b class='flag-5'>Blackwell</b> GPU性能測(cè)試

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    能比上一代NVIDIA Hopper?提高了15倍。采用第二代Transformer引擎、定制的Blackwell Tensor Core技術(shù)、TensorRT?-LLM和Nemo?框架的創(chuàng)新,顯著加速了
    發(fā)表于 05-13 17:16

    jAVA語(yǔ)言環(huán)境白皮書

    jAVA語(yǔ)言環(huán)境白皮書The Java Language Environment (A White Paper)1. Introduction to Java
    發(fā)表于 10-14 17:35

    ZigBee白皮書

    ZigBee白皮書
    發(fā)表于 08-20 09:50

    簡(jiǎn)儀科技怒對(duì)LabVIEW的白皮書

    本帖最后由 niezidong 于 2017-8-23 20:43 編輯 簡(jiǎn)儀科技最近搞的開(kāi)源平臺(tái)跟NI是針?shù)h相對(duì)啊。近期的宣傳都帶火藥味,還出了一本白皮書。見(jiàn)附件。這白皮書就差直接說(shuō)搞LabVIEW沒(méi)前途了。各位對(duì)此有何高見(jiàn)?
    發(fā)表于 08-11 15:55

    NVIDIA 推出 Blackwell 架構(gòu) DGX SuperPOD,適用于萬(wàn)億參數(shù)級(jí)的生成式 AI 超級(jí)計(jì)算

    基于先進(jìn)的 NVIDIA 網(wǎng)絡(luò)、NVIDIA 全棧 AI 軟件和存儲(chǔ)技術(shù),可將集群中 Grace Blackwell 超級(jí)芯片的數(shù)量擴(kuò)展至數(shù)萬(wàn)個(gè),通過(guò) NVIDIA NVLink可將多
    發(fā)表于 03-19 10:56 ?1247次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>Blackwell</b> 架構(gòu) DGX SuperPOD,適用于萬(wàn)億參數(shù)級(jí)的生成式 AI 超級(jí)計(jì)算

    NVIDIA推出搭載GB200 Grace Blackwell超級(jí)芯片的NVIDIA DGX SuperPOD?

    NVIDIA 于太平洋時(shí)間 3 月 18 日發(fā)布新一代 AI 超級(jí)計(jì)算機(jī) —— 搭載 NVIDIA GB200 Grace Blackwell 超級(jí)芯片的 NVIDIA DGX Sup
    的頭像 發(fā)表于 03-21 09:49 ?2190次閱讀

    NVIDIA未來(lái)1年的Blackwell訂單已全部售罄

    10月12日資訊顯示,Blackwell無(wú)疑已成為NVIDIA歷史上極為成功的產(chǎn)品典范,其市場(chǎng)需求量已攀升至前所未有的高峰。   憑借在全球AI算力領(lǐng)域的領(lǐng)先地位,Blackwell吸引了微軟、Meta、Oracle、Op
    的頭像 發(fā)表于 10-12 16:20 ?1703次閱讀

    NVIDIA向開(kāi)放計(jì)算項(xiàng)目捐贈(zèng)Blackwell平臺(tái)設(shè)計(jì)

    近日,在美國(guó)加利福尼亞州舉行的 OCP 全球峰會(huì)上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計(jì)算平臺(tái)的一些基礎(chǔ)元素捐贈(zèng)給開(kāi)放計(jì)算項(xiàng)目(OCP),并擴(kuò)大 NVIDIA
    的頭像 發(fā)表于 11-19 15:30 ?2256次閱讀

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開(kāi)啟 AI 推理新時(shí)代

    英偉達(dá)GTC25亮點(diǎn):NVIDIA Blackwell Ultra 開(kāi)啟 AI 推理新時(shí)代
    的頭像 發(fā)表于 03-20 15:35 ?1751次閱讀

    NVIDIA Blackwell數(shù)據(jù)手冊(cè)與NVIDIA Blackwell架構(gòu)技術(shù)解析

    NVIDIA Blackwell數(shù)據(jù)手冊(cè)與NVIDIA Blackwell 架構(gòu)技術(shù)解析
    的頭像 發(fā)表于 03-20 17:19 ?2718次閱讀

    NVIDIA RTX PRO 4500 Blackwell GPU測(cè)試分析

    今天我們帶來(lái)全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測(cè)試,對(duì)比上一代產(chǎn)品
    的頭像 發(fā)表于 08-28 11:02 ?4291次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 <b class='flag-5'>Blackwell</b> GPU測(cè)試分析

    NVIDIA RTX PRO 5000 72GB Blackwell GPU現(xiàn)已全面上市

    NVIDIA RTX PRO 5000 72GB Blackwell GPU 現(xiàn)已全面上市,將基于 NVIDIA Blackwell 架構(gòu)的強(qiáng)大代理式與生成式 AI 能力帶到更多桌面和
    的頭像 發(fā)表于 12-24 10:32 ?1052次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 72GB <b class='flag-5'>Blackwell</b> GPU現(xiàn)已全面上市

    NVIDIA RTX PRO 4000 Blackwell GPU性能測(cè)試

    作為 NVIDIA 專業(yè)顯卡產(chǎn)品線中單槽性能的巔峰之作,NVIDIA RTX PRO 4000 Blackwell 在各項(xiàng)核心指標(biāo)上均實(shí)現(xiàn)對(duì)前代 NVIDIA RTX 4000 Ada
    的頭像 發(fā)表于 12-29 15:30 ?1768次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 <b class='flag-5'>Blackwell</b> GPU性能測(cè)試

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)

    NVIDIA RTX PRO 5000 BlackwellNVIDIA RTX 5000 Ada Generation 的升級(jí)迭代產(chǎn)品,其各項(xiàng)核心指標(biāo)均針對(duì) GPU 加速工作流的高性能
    的頭像 發(fā)表于 01-06 09:51 ?3709次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 <b class='flag-5'>Blackwell</b> GPU的深度評(píng)測(cè)
    通江县| 调兵山市| 卢湾区| 濉溪县| 密山市| 乐亭县| 古蔺县| 义乌市| 车致| 苍梧县| 呼玛县| 岑巩县| 景德镇市| 富川| 江津市| 定襄县| 罗田县| 柯坪县| 湖北省| 博乐市| 惠安县| 贺州市| 清原| 青阳县| 新疆| 霸州市| 青岛市| 施秉县| 赤峰市| 高唐县| 西充县| 昌平区| 双辽市| 公安县| 龙州县| 凤翔县| 漾濞| 铁力市| 华安县| 应城市| 通山县|