哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DPU 技術發(fā)展概況系列(三) DPU的發(fā)展背景

中科馭數(北京)科技有限公司 ? 2022-04-06 14:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

DPU的出現(xiàn)是異構計算的又一個階段性標志。摩爾定律放緩使得通用CPU性能增長的邊際成本迅速上升,數據表明現(xiàn)在CPU的性能年化增長(面積歸一化之后)僅有3%左右,但計算需求卻是爆發(fā)性增長,這幾乎是所有專用計算芯片得以發(fā)展的重要背景因素。以AI芯片為例,最新的GPT-3等千億級參數的超大型模型的出現(xiàn),將算力需求推向了一個新的高度。DPU也不例外。隨著2019年我國以信息網絡等新型基礎設施為代表的“新基建”戰(zhàn)略帷幕的拉開,5G、千兆光纖網絡建設發(fā)展迅速,移動互聯(lián)網、工業(yè)互聯(lián)網、車聯(lián)網等領域發(fā)展日新月異。云計算、數據中心、智算中心等基礎設施快速擴容。網絡帶寬從主流10G朝著25G、40G、100G、200G甚至400G發(fā)展。網絡帶寬和連接數的劇增使得數據的通路更寬、更密,直接將處于端、邊、云各處的計算節(jié)點暴露在了劇增的數據量下,而CPU的性能增長率與數據量增長率出現(xiàn)了顯著的“剪刀差”現(xiàn)象。所以,尋求效率更高的計算芯片就成為了業(yè)界的共識。DPU芯片就是在這樣的趨勢下提出的。

一、帶寬性能增速比(RBP)失調

摩爾定律的放緩與全球數據量的爆發(fā)這個正在迅速激化的矛盾通常被作為處理器專用化的大背景,正所謂硅的摩爾定律雖然已經明顯放緩,但“數據摩爾定律”已然到來。IDC的數據顯示,全球數據量在過去10年年均復合增長率接近50%,并進一步預測每四個月對于算力的需求就會翻一倍。因此必須要找到新的可以比通用處理器帶來更快算力增長的計算芯片,DPU于是應運而生。這個大背景雖然有一定的合理性,但是還是過于模糊,并沒有回答DPU之所以新的原因是什么,是什么“量變”導致了“質變”?

從現(xiàn)在已經公布的各個廠商的DPU架構來看,雖然結構有所差異,但都不約而同強調網絡處理能力。從這個角度看,DPU是一個強IO型的芯片,這也是DPU與CPU最大的區(qū)別。CPU的IO性能主要體現(xiàn)在高速前端總線(在Intel的體系里稱之為FSB,F(xiàn)ront Side Bus),CPU通過FSB連接北橋芯片組,然后連接到主存系統(tǒng)和其他高速外設(主要是PCIe設備)。目前更新的CPU雖然通過集成存儲控制器等手段弱化了北橋芯片的作用,但本質是不變的。CPU對于處理網絡處理的能力體現(xiàn)在網卡接入鏈路層數據幀,然后通過操作系統(tǒng)(OS)內核態(tài),發(fā)起DMA中斷響應,調用相應的協(xié)議解析程序,獲得網絡傳輸的數據(雖然也有不通過內核態(tài)中斷,直接在用戶態(tài)通過輪詢獲得網絡數據的技術,如Intel的DPDK,Xilinx的Onload等,但目的是降低中斷的開銷,降低內核態(tài)到用戶態(tài)的切換開銷,并沒有從根本上增強IO性能)。可見,CPU是通過非常間接的手段來支持網絡IO,CPU的前端總線帶寬也主要是要匹配主存(特別是DDR)的帶寬,而不是網絡IO的帶寬。

相較而言,DPU的IO帶寬幾乎可以與網絡帶寬等同,例如,網絡支持25G,那么DPU就要支持25G。從這個意義上看,DPU繼承了網卡芯片的一些特征,但是不同于網卡芯片,DPU不僅僅是為了解析鏈路層的數據幀,而是要做直接的數據內容的處理,進行復雜的計算。所以,DPU是在支持強IO基礎上的具備強算力的芯片。簡言之,DPU是一個IO密集型的芯片;相較而言,GPU還是一個計算密集型芯片。

進一步地,通過比較網絡帶寬的增長趨勢和通用CPU性能增長趨勢,能發(fā)現(xiàn)一個有趣的現(xiàn)象:帶寬性能增速比(RBP,Ratioof Bandwidth and Performance growth rate)失調。RBP定義為網絡帶寬的增速比上CPU性能增速,即RBP=BW GR/Perf. GR如下圖所示,以Mellanox的ConnectX系列網卡帶寬作為網絡IO的案例,以Intel的系列產品性能作為CPU的案例,定義一個新指標“帶寬性能增速比”來反應趨勢的變化。

pYYBAGJNCUuADcc9AAUNDJD5fX0561.png

圖 帶寬性能增速比(RBP)失調

2010年前,網絡的帶寬年化增長大約是30%,到2015年微增到35%,然后在近年達到45%。相對應的,CPU的性能增長從10年前的23%,下降到12%,并在近年直接降低到3%。在這三個時間段內,RBP指標從1附近,上升到3,并在近年超過了10!如果在網絡帶寬增速與CPU性能增速近乎持平,RGR~1,IO壓力尚未顯現(xiàn)出來,那么當目前RBP達到10倍的情形下,CPU幾乎已經無法直接應對網絡帶寬的增速。RBP指標在近幾年劇增也許是DPU終于等到機會“橫空出世”的重要原因之一。

二、異構計算發(fā)展趨勢的助力

DPU首先作為計算卸載的引擎,直接效果是給CPU“減負”。DPU的部分功能可以在早期的TOE(TCP/IP Offloading Engine)中看到。正如其名,TOE就是將CPU的處理TCP協(xié)議的任務“卸載”到網卡上。傳統(tǒng)的TCP軟件處理方式雖然層次清晰,但也逐漸成為網絡帶寬和延遲的瓶頸。軟件處理方式對CPU的占用,也影響了CPU處理其他應用的性能。TCP卸載引擎(TOE)技術,通過將TCP協(xié)議和IP協(xié)議的處理進程交由網絡接口控制器進行處理,在利用硬件加速為網絡時延和帶寬帶來提升的同時,顯著降低了CPU處理協(xié)議的壓力。具體有三個方面的優(yōu)化:1)隔離網絡中斷,2)降低內存數據拷貝量,3)協(xié)議解析硬件化。這三個技術點逐漸發(fā)展成為現(xiàn)在數據平面計算的三個技術,也是DPU普遍需要支持的技術點。例如,NVMe協(xié)議,將中斷策略替換為輪詢策略,更充分的開發(fā)高速存儲介質的帶寬優(yōu)勢;DPDK采用用戶態(tài)調用,開發(fā)“Kernel-bypassing”機制,實現(xiàn)零拷貝(Zeor-Copy);在DPU中的面向特定應用的專用核,例如各種復雜的校驗和計算、數據包格式解析、查找表、IP安全(IPSec)的支持等,都可以視為協(xié)議處理的硬件化支持。所以,TOE基本可以被視為DPU的雛形。

延續(xù)TOE的思想,將更多的計算任務卸載至網卡側來處理,促進了智能網卡(SmartNIC)技術的發(fā)展。常見的智能網卡的基本結構是以高速網卡為基本功能,外加一顆高性能的FPGA芯片作為計算的擴展,來實現(xiàn)用戶自定義的計算邏輯,達到計算加速的目的。然而,這種“網卡+FPGA”的模式并沒有將智能網卡變成一個絕對主流的計算設備,很多智能網卡產品被當作單純的FPGA加速卡來使用,在利用FPGA優(yōu)勢的同時,也繼承了所有FPGA的局限性。DPU是對現(xiàn)有的SmartNIC的一個整合,能看到很多以往SmartNIC的影子,但明顯高于之前任何一個SmartNIC的定位。

Amazon的AWS在2013研發(fā)了Nitro產品,將數據中心開銷(為虛機提供遠程資源,加密解密,故障跟蹤,安全策略等服務程序)全部放到專用加速器上執(zhí)行。Nitro架構采用輕量化Hypervisor配合定制化的硬件,將虛擬機的計算(主要是CPU和內存)和I/O(主要是網絡和存儲)子系統(tǒng)分離開來,通過PCIe總線連接,節(jié)省了30%的CPU資源。阿里云提出的X-Dragon系統(tǒng)架構,核心是MOC卡,有比較豐富的對外接口,也包括了計算資源、存儲資源和網絡資源。MOC卡的核心X-Dragon SOC,統(tǒng)一支持網絡,IO、存儲和外設的虛擬化,為虛擬機、裸金屬、容器云提供統(tǒng)一的資源池。

可見,DPU其實在行業(yè)內已經孕育已久,從早期的網絡協(xié)議處理卸載,到后續(xù)的網絡、存儲、虛擬化卸載,其帶來的作用還是非常顯著的,只不過在此之前DPU“有實無名”,現(xiàn)在是時候邁上一個新的臺階了。

來源:專用數據處理器(DPU)技術白皮書,中國科學院計算技術研究所,鄢貴海等

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • DPU
    DPU
    +關注

    關注

    0

    文章

    417

    瀏覽量

    27147
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    中關村云計算產業(yè)聯(lián)盟黨建交流活動在中科馭數圓滿舉辦

    活動伊始,與會人員參觀了中科馭數 DPU 展廳,深入了解 DPU 技術在云計算領域的創(chuàng)新應用與發(fā)展前景。
    的頭像 發(fā)表于 01-23 15:20 ?707次閱讀

    【「芯片設計基石——EDA產業(yè)全景與未來展望」閱讀體驗】跟著本書來看EDA的奧秘和EDA發(fā)展

    ,技術特點維度,人才維度等,不同維度都可以看出EDA是一個難度很高的基礎技術,需要各方各維度的協(xié)同持續(xù)發(fā)展。 第二章介紹了全球EDA發(fā)展概況
    發(fā)表于 01-21 22:26

    基于DPU的智能盤框方案,華為如何大幅提升AI推理的效率?

    DPU
    腦極體
    發(fā)布于 :2026年01月20日 12:53:10

    【「芯片設計基石——EDA產業(yè)全景與未來展望」閱讀體驗】--EDA了解與發(fā)展概況

    ,市場穩(wěn)定增長、寡頭壟斷、地區(qū)發(fā)展不平衡。 EDA大巨頭,包括Synopsys、Candence、Siemens.這家公司成功具備技術創(chuàng)新與產品實力;市場份額與影響力;并購核心邏輯
    發(fā)表于 01-19 21:45

    彰顯硬科技實力 中科馭數榮登VENTURE50硬科技榜 構建DPU“運力”底座

    近日,由清科控股、投資界發(fā)起的 2025 VENTURE50(簡稱 V50)評選結果正式揭曉,DPU 芯片研發(fā)領軍企業(yè)中科馭數憑借深厚的技術壁壘、成熟的商業(yè)化能力及突出的產業(yè)價值,成功榮登 “2025 VENTURE 50 硬科技” 榜單,成為中國科技創(chuàng)新 “深水區(qū)” 的
    的頭像 發(fā)表于 12-13 11:26 ?1230次閱讀

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服務為 AI 數據存儲、網絡和安全帶來突破性的加速。
    的頭像 發(fā)表于 11-03 14:48 ?1205次閱讀

    RISC-V DPU,重塑數據中心算力格局?

    電子發(fā)燒友網綜合報道 在現(xiàn)代數據中心架構中,數據處理單元(DPU)正迅速崛起為繼 CPU 和 GPU 之后的第顆核心芯片。DPU 專為數據密集型任務設計,通過卸載 CPU 的低效工作負載,如網絡
    的頭像 發(fā)表于 09-13 00:51 ?5026次閱讀

    基于NVIDIA BlueField DPU的5G UPF數據面加速方案

    在第屆 NVIDIA DPU 黑客松競賽中,我們見證了開發(fā)者與 NVIDIA 網絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現(xiàn)了在 AI 網絡、存儲和安全等領域的創(chuàng)新突破。
    的頭像 發(fā)表于 09-04 11:26 ?1377次閱讀

    NVIDIA助力Axio團隊打造全新DPU數據面開發(fā)框架

    在第屆 NVIDIA DPU 黑客松競賽中,我們見證了開發(fā)者與 NVIDIA 網絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現(xiàn)了在 AI 網絡、存儲和安全等領域的創(chuàng)新突破。
    的頭像 發(fā)表于 08-30 15:58 ?1610次閱讀

    利用NVIDIA DPU重塑網絡安全格局

    在第屆 NVIDIA DPU 黑客松競賽中,我們見證了開發(fā)者與 NVIDIA 網絡技術的深度碰撞。在 23 支參賽隊伍中,有 5 支隊伍脫穎而出,展現(xiàn)了在 AI 網絡、存儲和安全等領域的創(chuàng)新突破。
    的頭像 發(fā)表于 08-20 14:31 ?1561次閱讀

    無刷雙饋電機專利技術發(fā)展

    ~~~ *附件:無刷雙饋電機專利技術發(fā)展.pdf 【免責聲明】本文系網絡轉載,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請第一時間告知,刪除內容,謝謝!
    發(fā)表于 06-25 13:10

    鋁電解電容技術發(fā)展與市場格局分析

    鋁電解電容的技術發(fā)展,市場需求狀況分析
    的頭像 發(fā)表于 06-23 15:30 ?1321次閱讀

    輪邊驅動電機專利技術發(fā)展

    ,具有較高的靈敏度。 本文主要以 DWPI 專利數據庫以及 CNABS 數據庫中的檢索結果為分析樣本,從專利文獻的視角對輪邊驅動電機的技術發(fā)展進行了全面的統(tǒng)計分析,總結了與輪邊驅動電機相關的國內和國外
    發(fā)表于 06-10 13:15

    屆NVIDIA DPU黑客松開啟報名

    屆 NVIDIA DPU 中國虛擬黑客松(Hackathon)將于 6 月 28 日 - 6 月 30 日正式開啟!作為備受廣大開發(fā)者期待的年度賽事,它將提供與 NVIDIA 加速網絡技術深度
    的頭像 發(fā)表于 05-27 10:16 ?1005次閱讀

    中科馭數攜DPU全棧產品亮相福州數博會,賦能智算時代算力基建

    會”)也拉開帷幕。共有150多家企業(yè)參展,展會吸引了八萬多名觀眾參觀。作為國內DPU領域領軍企業(yè),中科馭數攜大產品線亮相展會,其創(chuàng)新的DPU技術方案成為專業(yè)觀眾關注焦點。據大會報告的
    的頭像 發(fā)表于 05-23 11:01 ?756次閱讀
    中科馭數攜<b class='flag-5'>DPU</b>全棧產品亮相福州數博會,賦能智算時代算力基建
    曲周县| 沙洋县| 甘洛县| 奎屯市| 晋宁县| 上饶县| 阜城县| 格尔木市| 麻阳| 冕宁县| 齐河县| 读书| 茂名市| 昆山市| 酒泉市| 定南县| 葵青区| 南平市| 城固县| 哈尔滨市| 三江| 南昌县| 华阴市| 黑山县| 江永县| 临洮县| 如皋市| 茂名市| 张掖市| 大石桥市| 兴宁市| 西宁市| 大城县| 鹰潭市| 惠来县| 乌兰县| 晋城| 靖江市| 荆门市| 宁明县| 六盘水市|