哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA DOCA 3.0版本的亮點解析

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2025-07-04 14:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎設施的重要組成部分。從初始版本到備受期待的NVIDIA DOCA 3.0發(fā)布,每個版本都擴展了NVIDIA BlueField DPU和ConnectX SuperNIC的功能,從而實現了前所未有的 AI 平臺可擴展性和性能。

通過豐富的庫和服務生態(tài)系統(tǒng),DOCA 充分利用 BlueField DPU 和 SuperNIC,實現了在超過 10 萬個 GPU 上的超大規(guī)模部署,同時保持嚴格的租戶隔離并優(yōu)化資源利用率。DOCA 的安全功能可為容器化 AI 工作負載提供硬件級威脅檢測,而不會對性能造成影響。DOCA 的智能數據加速功能解決了 AI 數據流水線中的關鍵瓶頸,而其編排功能則簡化了復雜的 DPU 加速服務部署。

本文將介紹 DOCA 3.0,它代表了這些進步的最終成果。DOCA 3.0 為 AI 工廠提供全新升級的基礎設施服務,并為 AI 數據中心基礎設施提供優(yōu)化的框架,為開發(fā)者提供構建安全、高效的 AI 基礎設施所需的必要工具,其規(guī)模之大前所未有。如今,一個廣泛且蓬勃發(fā)展的開發(fā)者社區(qū)正在使用 DOCA,這項技術將繼續(xù)改變企業(yè)部署、管理和編排基礎設施的方式,為未來的 AI 創(chuàng)新提供支持。

DOCA 3.0 簡介

在當今快速發(fā)展的 AI 領域中,支持大規(guī)模 AI 部署的基礎設施與模型本身同樣重要。隨著企業(yè)從實驗性 AI 項目擴展到生產就緒型部署,底層計算、網絡和存儲基礎設施必須不斷發(fā)展,以滿足前所未有的需求。DOCA 正是這一發(fā)展的核心,它正在徹底改變開發(fā)者構建、部署和管理下一代 AI 平臺的方式。

最新版本的 DOCA 3.0 為開發(fā)者提供了豐富的庫、驅動和 API,幫助他們?yōu)?NVIDIA BlueField DPU 和 Connect-X SuperNIC 創(chuàng)建高性能應用程序和服務。這一創(chuàng)新框架可將資源密集型任務從 CPU 卸載到專用硬件加速器,從而顯著提高 AI 工作負載的性能、安全性和效率。

DOCA 3.0 的亮點包括:

DOCA 支持 InfiniBand Quantum-X800 和 ConnectX-8 SuperNIC (GA)

用于 NIM 容器威脅檢測的全新 DOCA Argus 服務

DOCA 平臺框架(DPF)可信主機用例(GA)

使用 BlueField-3 的 DOCA SNAP Virtio-fs(測試版)文件系統(tǒng)仿真

適用于 AI 計算集群的 DOCA Perftest(GA)RDMA 基準工具

396aaa2a-57fc-11f0-baa5-92fbcf53809c.png

圖 1:NVIDIA DOCA 3.0 堆棧

超大規(guī)模 GPU 計算:擴展多租戶 AI 工廠

構建具有更多參數和訓練數據的更大規(guī)模 AI 模型的競賽,將計算需求推向了前所未有的高度?,F代 AI 工廠必須支持涵蓋數萬個 GPU 的大規(guī)模部署,同時保持租戶之間嚴格的性能隔離。

DOCA 通過其網絡庫解決這一挑戰(zhàn),這些庫在多租戶環(huán)境中實現高效的資源利用和工作負載隔離。具體而言,DOCA RDMA 庫提供了對大規(guī)模分布式 AI 訓練至關重要的高性能、低延遲通信功能。該庫支持節(jié)點之間的直接內存訪問,無需 CPU 參與,從而顯著降低多 GPU 系統(tǒng)中的通信開銷。

DOCA GPUNetIO 庫通過 GPUDirect Async Kernal-initiated 通信(GDAKI),在網絡中提供 GPU 之間的直接數據路徑,進一步增強 GPU 之間的通信,從而實現對分布式訓練算法至關重要的高效集合操作。這些庫與 DOCA 以太網、DOCA RDMA 或 DOCA DMA 協同工作,構建了一個高性能網絡基礎,可以擴展到支持超過 10 萬個 GPU 的部署。

傳統(tǒng)的軟件定義數據中心方法可能會消耗 30% 甚至更多的服務器 CPU 核心。通過DOCA Flow等庫將這些功能卸載到 BlueField DPU,DOCA 可以釋放寶貴的 CPU 資源用于 AI 計算,這相當于 30 多個 CPU 核心的性能。DOCA Flow 庫支持復雜的數據包處理和流管理,支持大規(guī)模 AI 工廠中復雜的流量模式。

適用于 AI 工作負載的多租戶隔離

DOCA 架構通過其基于主機的網絡服務提供強大的隔離機制,確保來自不同租戶的工作負載保持安全隔離。該服務在租戶環(huán)境之間實施硬件強制隔離,防止未經授權的訪問,同時實現 AI 的無縫執(zhí)行。對于將敏感 AI 工作負載與其他應用程序一同運行的云服務提供商和企業(yè)而言,此功能至關重要。

強大的威脅檢測:實時保護 AI 工作負載

隨著 AI 系統(tǒng)對業(yè)務運營的重要性與日俱增,保護其免受威脅也變得至關重要。DOCA 釋放了 BlueField DPU 和 SuperNIC 的網絡安全潛力,支持快速創(chuàng)建和集成應用程序,從而卸載和加速加密、分布式防火墻、入侵檢測和網絡微分段等安全任務。

通過結合使用 DOCA 庫,NVIDIA 網絡安全 AI 平臺利用硬件級檢測提供對網絡流量和系統(tǒng)行為的深度可視性。與依賴軟件代理的傳統(tǒng)安全解決方案不同,BlueField DPU 充當嵌入式安全處理器,可將關鍵的網絡安全任務從傳統(tǒng) CPU 上卸載。這種方法可以在不影響系統(tǒng)性能的情況下實現實時監(jiān)測和保護。

DOCA 支持的安全應用程序可以:

持續(xù)分析遙測數據,識別潛在威脅的模式和異常

通過 AI 驅動的異常檢測提供實時威脅檢測

在風險升級為重大安全事件之前主動降低風險

在 AI 組件之間實施強大的加密和安全通信通道

對于 AI 工作負載,這種安全架構具有顯著優(yōu)勢。AI 模型和訓練數據通常代表著寶貴的知識產權,因此成為攻擊的主要目標。DOCA 支持機密計算功能,可保護部署在 NVIDIA Blackwell 和 NVIDIA Hopper GPU 上的 AI 模型、算法和數據的機密性和完整性。

此外,DOCA 的安全功能能夠應對 AI 驅動環(huán)境中 IT 和 OT 系統(tǒng)融合所帶來的復雜威脅形勢。通過提供硬件加速的安全功能,DOCA 可確保安全措施不會成為 AI 應用的性能瓶頸。

加速下一代 AI 的數據處理

數據處理是現代 AI 工作流中最重大的挑戰(zhàn)之一。最新一代的 AI 模型需要前所未有的海量訓練數據,這給存儲和網絡基礎設施帶來了巨大壓力。

DOCA 通過其全面的數據加速功能來解決這一挑戰(zhàn)。該框架的數據路徑加速器利用 BlueField-3 DPA 編程子系統(tǒng)提供一種編程模型,可將以通信為中心的用戶代碼卸載到專用的 DPA 處理器上運行。這種卸載功能可顯著降低 CPU 開銷,同時通過 DPU 加速來提高性能。

此外,為了優(yōu)化 AI 流水線中的數據壓縮,DOCA 壓縮庫提供了硬件加速的壓縮和解壓縮功能。此功能可在不增加 CPU 或 GPU 計算負載的情況下減少數據傳輸時間和存儲需求。同樣,DOCA Erasure Coding 庫提供了彈性數據存儲功能,這對于保護寶貴的 AI 數據集至關重要。

為了應對現代 AI 工作流帶來的挑戰(zhàn),DOCA Flow 庫實現了 AI 數據流水線的高性能網絡,它提供了先進的數據包處理功能,可優(yōu)化整個網絡中的數據移動。DOCA Rivermax 庫通過提供高級功能來簡化存儲系統(tǒng)和計算節(jié)點之間的數據傳輸,從而進一步提高網絡性能。

優(yōu)化 AI 數據流水線的網絡性能

DOCA 基于主機的網絡(HBN)3.0 為無控制器 VPC 網絡提供了顯著的可擴展性改進,支持高達八千個 VTEP 和八萬個 Type-5 路由,并計劃增加對一萬六千甚至更多個 VTEP 的支持。此外,DOCA 3.0 還為 HBN 引入了兩項附加功能:雙向轉發(fā)檢測(BFD)支持[GA],通過主動鏈路監(jiān)測實現快速路由收斂,以及 ECMP 故障轉移增強功能,通過更快的故障轉移確保最大限度的減少停機時間。

總的來說,這些功能使 HBN 成為裸金屬部署的理想選擇,并使 AI 平臺能夠處理存儲系統(tǒng)、計算節(jié)點和外部數據源之間的海量數據流。

對于 AI 開發(fā)者來說,DOCA 智能數據平臺功能可轉化為:

降低訓練和推理流水線的數據處理延遲

提高數據密集型 AI 操作的吞吐量

提高計算和存儲基礎設施的資源利用效率

支持 IPMX 等新興視聽 AI 應用標準

增強的 DOCA FireFly 服務通過硬件加速帶來了先進的時間同步功能,提供分布式 AI 訓練工作負載所必需的高精度同步能力。此功能可實現跨 GPU 集群的更高效協調,這對于大規(guī)模訓練和模型并行等技術尤為重要。

DPU 驅動的基礎設施服務無縫管理

現代 AI 基礎設施的復雜性要求具備先進的編排能力。DOCA 3.0 針對可信主機的 DOCA 平臺框架(DPF)已正式發(fā)布,它將 Kubernetes 控制平面功能擴展到 DPU,使管理員能夠部署和編排 NVIDIA DOCA 服務和第三方應用程序。

DOCA 服務是基于 DOCA 的容器化產品,采用容器封裝,可在 BlueField DPU 上便捷部署。這些服務利用 DPU 功能來提供遙測、時間同步、網絡解決方案等功能,所有這些功能都可以通過 NGC 目錄獲取。

39878474-57fc-11f0-baa5-92fbcf53809c.png

圖 2:DOCA 平臺框架堆棧(GA)

通過引入專用的輔助 Kubernetes 控制平面,DPF 使管理員能夠高效管理部署在 BlueField DPU 上的 DOCA 服務。該框架簡化了 DPU 管理的復雜性,使管理員能夠與熟悉的 Kubernetes 結構進行交互。這種方法顯著簡化了 AI 基礎設施服務的部署和運維。

DPF 服務的功能鏈功能可在單個 DPU 上集成加速網絡、高性能數據服務、安全功能等多種服務。這種編排功能創(chuàng)建了一個靈活的多供應商生態(tài)系統(tǒng),從而為 AI 應用提供加速網絡服務。

實際部署展示了這種方法的切實優(yōu)勢。NVIDIA DOCA 平臺框架與 Red Hat OpenShift 的集成已顯示出顯著的性能提升,RDMA 測試的平均帶寬達到 383.72Gb/s。這種網絡性能水平對于 LLM 等數據密集型 AI 工作負載至關重要。

對于 AI 平臺運營商,DOCA 基礎設施服務編排功能提供:

簡化復雜 AI 優(yōu)化基礎設施的部署和管理

強大的生命周期管理,實現無縫的服務更新、擴展和回滾

部署前驗證,確保兼容性和需求得到滿足

實時監(jiān)測和可調試性,確保高可靠性

加速并保護 NVIDIA NIM 微服務和 AI 工作負載

利用 DOCA 平臺框架的先進編排功能、DOCA HBN、OVS-DOCA、DOCA SNAP Virtio-fs 以及最新服務NVIDIA DOCA Argus相結合,加速和保護 NVIDIA NIM 微服務和 AI 工作負載。這凸顯了 DOCA 不斷發(fā)展的價值,并讓我們一窺未來解決方案將如何從框架中不斷涌現。

DOCA Argus 是一個網絡安全框架,旨在通過在 BlueField DPU 上提供無代理實時威脅檢測來保護 AI 工廠。Argus 獨立于主機系統(tǒng)運行,其攻擊檢測和響應速度比傳統(tǒng)解決方案快 1000 倍,且不會影響性能。

它與企業(yè)安全系統(tǒng)無縫集成,提供持續(xù)監(jiān)測和自動威脅緩解。Augus 利用先進的內存取證和可操作情報,經過優(yōu)化,可大規(guī)模保護容器化和多租戶 AI 工作負載。

DOCA Argus 與 OVS-DOCA 和 DOCA SNAP Virtio-fs 相結合,為 NVIDIA BlueField DPU 上的 AI 工作負載形成了創(chuàng)新的安全解決方案,解決了不同的基礎設施層問題,同時實現了跨組件威脅緩解。

39973df6-57fc-11f0-baa5-92fbcf53809c.png

圖 3:使用 DOCA 3.0 加速并保護

NIM 微服務和 AI 工作負載

DOCA Argus(計算層)通過 DPU 級內存和進程分析監(jiān)測 AI 工作負載,并依賴 OVS-DOCA 卸載和隔離網絡流量(網絡層)。同時,DOCA SNAP Virtio-fs(存儲層)通過 DPU 模擬的 Virtio 設備虛擬化文件系統(tǒng)訪問,將存儲 IO 與主機內核隔離開來,并為 Argus 提供異常訪問模式的審計日志。

該集成框架將安全性嵌入到計算層、網絡層和存儲層中,為 NIM 微服務實現亞毫秒級威脅響應,同時保持容器化 AI 流水線的可擴展性。

開始使用 DOCA 3.0

隨著 AI 持續(xù)變革各行各業(yè),支撐其發(fā)展的基礎設施必須隨之發(fā)展。NVIDIA DOCA 框架代表著開發(fā)者構建和部署 AI 平臺方式的根本性轉變,并通過其全面的庫和服務提供前所未有的性能、安全性和效率。

DOCA SDK 圍繞不同的 DOCA 庫構建,旨在充分利用 BlueField DPU 的功能。借助 20 多個專用庫,開發(fā)者可以通過強大的工具包來構建優(yōu)化的 AI 基礎設施。

DOCA 服務通過為特定用例提供容器化解決方案來補充這些庫。您可以通過NGC 目錄(例如 DOCA 和 DPU)來找到它們。這種容器化方法可以快速部署并簡化對 AI 運營至關重要的基礎設施組件的管理。

DOCA 還在持續(xù)演進,定期更新框架并推出新功能,確保開發(fā)者能夠始終處于 AI 基礎設施創(chuàng)新的前沿。目前已有成千上萬的開發(fā)者在使用 DOCA,其生態(tài)系統(tǒng)繼續(xù)發(fā)展壯大,為 AI 應用開發(fā)帶來了新的可能。

對于希望構建下一代 AI 平臺的開發(fā)者,NVIDIA DOCA 提供了全面的工具包,幫助他們充分發(fā)揮 BlueField DPU 和 Connect-X SuperNIC 的潛力,以創(chuàng)建可以擴展的基礎設施來滿足未來 AI 工作負載需求。通過采用 DOCA,企業(yè)站在 AI 基礎設施創(chuàng)新的前沿,為 AI 發(fā)展的新紀元做好準備。

NVIDIA DOCA 3.0 標志著 AI 計算網絡架構和云計算基礎設施的重大進步。

開啟您的開發(fā)之旅,享受 DOCA 提供的一切優(yōu)勢。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5678

    瀏覽量

    110073
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5253

    瀏覽量

    136017
  • 網絡
    +關注

    關注

    14

    文章

    8323

    瀏覽量

    95512
  • AI
    AI
    +關注

    關注

    91

    文章

    40820

    瀏覽量

    302428

原文標題:NVIDIA DOCA 3.0 助力 AI 平臺開啟網絡新紀元

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    75W單輸出工業(yè)DIN導軌電源DR - 75系列:性能與設計亮點解析

    75W單輸出工業(yè)DIN導軌電源DR - 75系列:性能與設計亮點解析 在工業(yè)電源領域,一款性能穩(wěn)定、功能全面的電源產品對于保障設備正常運行至關重要。今天,我們就來深入剖析75W單輸出工業(yè)DIN導軌
    的頭像 發(fā)表于 04-04 15:05 ?572次閱讀

    深演智能DeepAgent 3.0版本助力決策新范式

    在深演智能剛剛結束的“AI AGENT賦能業(yè)務增長”高峰閉門會上正式發(fā)布了新一代企業(yè)級智能體 DeepAgent 3.0版本,并推出了二十余款企業(yè)級智能體應用,覆蓋從用戶運營、廣告、銷售/客服、social營銷到產品創(chuàng)新、GTM、用戶洞察七大領域。
    的頭像 發(fā)表于 02-11 13:16 ?632次閱讀

    深演智能發(fā)布新一代企業(yè)級AI智能體平臺DeepAgent 3.0版本

    1月27日,深演智能在舉辦的“AI AGENT賦能業(yè)務增長”高峰閉門會上正式發(fā)布了新一代企業(yè)級AI智能體平臺 DeepAgent 3.0版本。此次升級推出了二十余款智能體應用,覆蓋:從用戶運營、廣告
    的頭像 發(fā)表于 01-29 09:23 ?808次閱讀

    超擎數智為您深度解析NVIDIA Quantum-X800 InfiniBand平臺

    NVIDIA
    專精特新
    發(fā)布于 :2026年01月08日 19:47:03

    Matter 1.5版本解析,智能家居又添驚喜

    連接標準聯盟推出Matter 1.5版本,增強設備互操作性,華普微支持其落地測試,推動智能家居生態(tài)發(fā)展。
    的頭像 發(fā)表于 12-13 16:50 ?3294次閱讀

    NVIDIA CUDA 13.1版本的新增功能與改進

    NVIDIA CUDA 13.1 是自 CUDA 二十年前發(fā)明以來,規(guī)模最大、內容最全面的一次更新。
    的頭像 發(fā)表于 12-13 10:08 ?2400次閱讀

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服務為 A
    的頭像 發(fā)表于 11-03 14:48 ?1181次閱讀

    Quartus Prime Pro 25.1版本的安裝和使用

    如果用戶開發(fā)板是基于Agilex 3、Agilex 5等高階器件,則需要安裝高版本的Quartus軟件比如Quartus Prime Pro 25.1版本,這個版本在安裝包和license獲?。赓M)等方面跟以往的Quartus
    的頭像 發(fā)表于 10-07 13:06 ?3053次閱讀
    Quartus Prime Pro 25.1<b class='flag-5'>版本</b>的安裝和使用

    Keithley靜電計通斷測量要點解析

    在現代電子測試中,Keithley靜電計憑借其高精度與穩(wěn)定性成為科研和工業(yè)領域的常用工具。進行通斷測量時,準確掌握操作要點是確保數據可靠性的關鍵。以下是使用Keithley靜電計進行通斷測量的核心要點解析
    的頭像 發(fā)表于 09-09 11:44 ?751次閱讀
    Keithley靜電計通斷測量要<b class='flag-5'>點解析</b>

    NVIDIA RAPIDS 25.06版本新增多項功能

    RAPIDS 是一套面向 Python 數據科學的 NVIDIA CUDA-X 庫,最新發(fā)布的 25.06 版本引入了多項亮眼新功能,其中包括 Polars GPU 流執(zhí)行引擎——這是一種面向圖
    的頭像 發(fā)表于 09-09 09:54 ?1217次閱讀

    transcosmos在中國發(fā)布全渠道智能客服平臺&quot;transCxLink&quot;3.0版本

    渠道智能客服平臺"transCxLink"3.0版本,這一全新版本在繼承前代產品優(yōu)勢的基礎上,結合當前最新的AI大模型技術,實現了更多客服功能的智能化革新與迭代升級。 transCxLink
    的頭像 發(fā)表于 07-02 09:43 ?626次閱讀
    transcosmos在中國發(fā)布全渠道智能客服平臺&quot;transCxLink&quot;<b class='flag-5'>3.0</b><b class='flag-5'>版本</b>

    請問k230創(chuàng)樂博V3.0版本如何使用ADB傳輸文件呢?

    請問k230 創(chuàng)樂博V3.0版本如何使用ADB傳輸文件?
    發(fā)表于 06-24 07:57

    第三屆NVIDIA DPU黑客松開啟報名

    碰撞的絕佳機會。本次競賽采用開放式主題,參與者將通過 NVIDIA DOCA 軟件框架構建創(chuàng)新的加速應用程序,充分挖掘 NVIDIA BlueField DPU 在 AI、網絡、存儲和安全等領域的強大潛能。
    的頭像 發(fā)表于 05-27 10:16 ?990次閱讀

    NVIDIA將為每家AI工廠提供網絡安全

    NVIDIA DOCA Argus 框架可檢測 AI 工作負載中的威脅并對之做出響應,同時與企業(yè)安全系統(tǒng)無縫集成,從而提供實時洞察。
    的頭像 發(fā)表于 05-07 15:11 ?1107次閱讀
    <b class='flag-5'>NVIDIA</b>將為每家AI工廠提供網絡安全

    NVIDIA NVLink 深度解析

    訓練萬億參數人工智能模型至關重要 ^4^。深度分析報告旨在全面探討 NVIDIA NVLink,涵蓋其定
    的頭像 發(fā)表于 05-06 18:14 ?5650次閱讀
    封丘县| 伊吾县| 龙海市| 长乐市| 梅河口市| 上杭县| 黑河市| 丰台区| 六枝特区| 封开县| 锦州市| 高陵县| 武平县| 旅游| 醴陵市| 汾阳市| 上思县| 正镶白旗| 泾川县| 潜山县| 巴中市| 新平| 安徽省| 武功县| 涡阳县| 赤水市| 西乌珠穆沁旗| 临西县| 博白县| 若羌县| 高淳县| 保康县| 腾冲县| 凉山| 康保县| 宿州市| 桐柏县| 桐梓县| 久治县| 长岭县| 南安市|