哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

何為異構芯片 協(xié)同異構AI芯片的挑戰(zhàn)

AI芯天下 ? 來源:晶上聯(lián)盟 ? 2024-02-25 13:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

進入大模型時代,全社會算力需求被推高到了前所未有的程度。

由于大模型AI對于全社會的重要性,以及各行各業(yè)加快建設智算中心,也引發(fā)了全社會學習異構AI芯片的熱潮。

異構AI芯片出現(xiàn)的現(xiàn)象

2024年1月,微軟聯(lián)合創(chuàng)始人比爾·蓋茨與OpenAI首席執(zhí)行官山姆·奧特曼進行了一次對話,奧特曼在對話中表示人工智能將引發(fā)人類歷史上“最快”的一次技術革命,人類可能還沒有準備好以多快的速度適應這種變革。

奧特曼預計,這項技術將迅速發(fā)展,使系統(tǒng)的計算能力達到GPT-4的10萬倍或100萬倍。

簡單來說,用于人工智能計算的英偉達GPU芯片遠遠不夠用了。

而為應對GPU全球供應短缺問題,以及美國對GPU的出口限制問題,當然更重要的是在AI場景下降低成本,于是市場上涌現(xiàn)了各類異構AI芯片。

何為異構芯片

異構芯片即結合兩種或多種不同類型的處理器控制器架構的芯片。

異構芯片可以是CPU+FPGA,CPU+GPU也可以是CPU+AI,也可以是CPU+動態(tài)可重構等不同架構,這些架構都是利用一種架構的優(yōu)勢來彌補另外一種架構的不足,以適應用戶多種用途的應用需求。

Intel的CPU+Altera的FPGA或者AMD的Instinct MI300和英偉達的Grace Hopper超級芯片也是采用“CPU+GPU”的異構形式。

CPU+GPU架構的優(yōu)勢

CPU和GPU協(xié)同工作時,CPU包含幾個專為串行處理而優(yōu)化的核心,GPU則由數(shù)以千計更小、更節(jié)能的核心組成,這些核心專為提供強勁的并行運算性能而設計。

程序的串行部分在CPU上運行,而并行部分則在GPU上運行。

GPU目前已經(jīng)發(fā)展到成熟階段,可輕松執(zhí)行現(xiàn)實生活中的各種應用程序,而且程序運行速度已遠遠超過使用多核系統(tǒng)時的情形。

因此,CPU和GPU的結合剛好可以解決深度學習模型訓練在CPU上耗時長的問題,提升深度學習模型的訓練效率。

CPU與GPU的應用場景也不斷拓寬

隨著CPU與GPU的結合,其相較于單獨CPU與GPU的應用場景也不斷拓寬。

CPU+GPU架構適用于處理高性能計算。伴隨著高性能計算類應用的發(fā)展,驅(qū)動算力需求不斷攀升,但目前單一計算類型和架構的處理器已經(jīng)無法處理更復雜、更多樣的數(shù)據(jù)。

數(shù)據(jù)中心如何在增強算力和性能的同時,具備應對多類型任務的處理能力,成為全球性的技術難題。

CPU+GPU的異構并行計算架構作為高性能計算的一種主流解決方案,受到廣泛關注。

CPU+GPU架構適用于處理數(shù)據(jù)中心產(chǎn)生的海量數(shù)據(jù)。數(shù)據(jù)爆炸時代來臨,使用單一架構來處理數(shù)據(jù)的時代已經(jīng)過去。

比如:個人互聯(lián)網(wǎng)用戶每天產(chǎn)生約1GB數(shù)據(jù),智能汽車每天約50GB,智能醫(yī)院每天約3TB數(shù)據(jù),智慧城市每天約50PB數(shù)據(jù)。

數(shù)據(jù)的數(shù)量和多樣性以及數(shù)據(jù)處理的地點、時間和方式也在迅速變化。無論工作任務是在邊緣還是在云中,不管是人工智能工作任務還是存儲工作任務,都需要有正確的架構和軟件來充分利用這些特點。

CPU+GPU架構可以共享內(nèi)存空間,消除冗余內(nèi)存副本來改善問題。

在此前的技術中,雖然GPU和CPU已整合到同一個芯片上,但是芯片在運算時要定位內(nèi)存的位置仍然得經(jīng)過繁雜的步驟,這是因為CPU和GPU的內(nèi)存池仍然是獨立運作。

為了解決兩者內(nèi)存池獨立的運算問題,當CPU程式需要在GPU上進行部分運算時,CPU都必須從CPU的內(nèi)存上復制所有的資料到GPU的內(nèi)存上,而當GPU上的運算完成時,這些資料還得再復制回到CPU內(nèi)存上。

然而,將CPU與GPU放入同一架構,就能夠消除冗余內(nèi)存副本來改善問題,處理器不再需要將數(shù)據(jù)復制到自己的專用內(nèi)存池來訪問/更改該數(shù)據(jù)。

統(tǒng)一內(nèi)存池還意味著不需要第二個內(nèi)存芯片池,即連接到CPU的DRAM

因此,通過CPU+GPU異構并行計算架構組成的服務器,正成為服務器市場中的一匹黑馬?,F(xiàn)在已有多家芯片廠商開始跟進。

協(xié)同異構AI芯片的挑戰(zhàn)

在實際建設智算中心的時候,到底在GPU、FPGA、DSA和ASIC之間選擇哪種算力和算力組合,這是一個很大的問題。

GPU雖然能夠應對大模型計算需求,但一卡難求以及限制性能等問題嚴重;

DSA靈活性有限,硬件和軟件架構呈現(xiàn)碎片化;

FPGA的功耗和成本較高,主要用于原型驗證,難以在實際場景中大規(guī)模落地;

ASIC功能固化,缺乏足夠的靈活性,而且ASIC芯片的研發(fā)周期長、成本高和風險大等,都為大規(guī)模和長期采用帶來了挑戰(zhàn)。

另外,多異構計算的硬件層次高集成度和系統(tǒng)軟件層次多協(xié)同、通用編程模型和開發(fā)環(huán)境等,都是行業(yè)需要解決的問題,多異構共存的異構計算孤島現(xiàn)象越來越突顯。

特別是不同的異構計算編程框架,要求開發(fā)者掌握多種編程模式和語言,使得代碼移植面臨巨大挑戰(zhàn)。

尋找一個真正統(tǒng)一、能滿足所有硬件和應用需求的編程方法,仍是當下計算領域的熱門研究課題。

結尾:可發(fā)展產(chǎn)業(yè)機遇

大模型AI的出現(xiàn),為重構數(shù)據(jù)中心帶來了機遇。由于大模型AI天然帶來海量的數(shù)據(jù)中心內(nèi)部通信而不是對外通信,在將數(shù)據(jù)中心重構為智算中心的時候,就帶來了“一個數(shù)據(jù)中心即為一臺計算機”的設計理念,這就是以系統(tǒng)設計為中心的原則。

以系統(tǒng)設計為中心,即考慮一個數(shù)據(jù)中心上承載大模型訓練等邏輯上單一的“大應用”,也就是數(shù)據(jù)中心級的業(yè)務系統(tǒng)。

因此在智算中心的設計上要超越硬件和軟件的傳統(tǒng)界限,將整個數(shù)據(jù)中心作為一個協(xié)同工作的系統(tǒng)。

有了以數(shù)據(jù)中心為一臺計算機的設計理念和角度,就能找到有效的軟硬件協(xié)同的異構融合計算之路。

內(nèi)容及圖片來源于:晶上聯(lián)盟



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20323

    瀏覽量

    254604
  • 控制器
    +關注

    關注

    114

    文章

    17859

    瀏覽量

    194969
  • AI芯片
    +關注

    關注

    17

    文章

    2161

    瀏覽量

    36858
  • 異構芯片
    +關注

    關注

    0

    文章

    9

    瀏覽量

    2462

原文標題:趨勢丨2024年再怎么重視“異構芯片”都不為過

文章出處:【微信號:World_2078,微信公眾號:AI芯天下】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    基于openEuler平臺的CPU、GPU與FPGA異構加速實戰(zhàn)

    隨著 AI、視頻處理、加密和高性能計算需求的增長,單一 CPU 已無法滿足低延遲、高吞吐量的計算需求。openEuler 作為面向企業(yè)和云端的開源操作系統(tǒng),在 多樣算力支持 方面表現(xiàn)出色,能夠高效調(diào)度 CPU、GPU、FPGA 及 AI 加速器,實現(xiàn)
    的頭像 發(fā)表于 04-08 11:02 ?490次閱讀
    基于openEuler平臺的CPU、GPU與FPGA<b class='flag-5'>異構</b>加速實戰(zhàn)

    多Chiplet異構集成的先進互連技術

    半導體產(chǎn)業(yè)正面臨傳統(tǒng)芯片縮放方法遭遇基本限制的關鍵時刻。隨著人工智能和高性能計算應用對計算能力的需求呈指數(shù)級增長,業(yè)界已轉(zhuǎn)向多Chiplet異構集成作為解決方案。本文探討支持這一轉(zhuǎn)變的前沿互連技術,內(nèi)容來自新加坡微電子研究院在2025年HIR年會上發(fā)表的研究成果[1]。
    的頭像 發(fā)表于 02-02 16:00 ?2661次閱讀
    多Chiplet<b class='flag-5'>異構</b>集成的先進互連技術

    工信部力推:國產(chǎn)訓練芯片異構算力引領AI新征程

    部將以落實《實施意見》為抓手,推動人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展,技術創(chuàng)新是重點,突破訓練芯片、異構算力等關鍵技術是關鍵。 ? 訓練芯片AI模型基石與技術攻堅核心 ? 訓練
    的頭像 發(fā)表于 01-21 14:11 ?1.1w次閱讀

    西門子Innovator3D IC異構集成平臺解決方案

    Innovator3D IC 使用全新的半導體封裝 2.5D 和 3D 技術平臺與基底,為 ASIC 和小芯片的規(guī)劃和異構集成提供了更快和更可預測的路徑。
    的頭像 發(fā)表于 01-19 15:02 ?463次閱讀
    西門子Innovator3D IC<b class='flag-5'>異構</b>集成平臺解決方案

    算力并購狂歡下的隱秘戰(zhàn)場:AI芯片如何通過“燒錄大考”?

    英偉達收購 Groq 引發(fā)行業(yè)關注之際,AI 芯片測試與燒錄已成為制約產(chǎn)能與性能的關鍵瓶頸,其耗時占比超 30%。傳統(tǒng)方案受困于芯片異構集成、動態(tài)配置帶來的復雜度,面臨速度、功耗管理及
    的頭像 發(fā)表于 12-29 17:31 ?664次閱讀
    算力并購狂歡下的隱秘戰(zhàn)場:<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>如何通過“燒錄大考”?

    全方位解析:什么是異構開發(fā)板?為什么選GM-3568JHF?

    異構開發(fā)板集成兩種或多種處理器,如ARM與FPGA。ARM負責通用控制,F(xiàn)PGA加速特定工作,二者協(xié)同保證系統(tǒng)靈活性與高性能。與普通開發(fā)板相比,異構開發(fā)板功能更靈活,效率更高,適合復雜任務
    的頭像 發(fā)表于 12-19 15:04 ?7441次閱讀
    全方位解析:什么是<b class='flag-5'>異構</b>開發(fā)板?為什么選GM-3568JHF?

    全志V861系列芯片推動端側(cè)AI視覺應用落地

    全志V861系列智能視覺處理芯片,以運力、算力雙維減耗為核心設計理念,通過異構計算架構與AI-ISP硬件單元的深度協(xié)同,在保證高性能的同時顯著優(yōu)化系統(tǒng)資源消耗,同時形成最新低功耗解決方
    的頭像 發(fā)表于 11-18 15:32 ?1716次閱讀
    全志V861系列<b class='flag-5'>芯片</b>推動端側(cè)<b class='flag-5'>AI</b>視覺應用落地

    國產(chǎn)AI芯片真能扛住“算力內(nèi)卷”?海思昇騰的這波操作藏了多少細節(jié)?

    最近行業(yè)都在說“算力是AI的命門”,但國產(chǎn)芯片真的能接住這波需求嗎? 前陣子接觸到海思昇騰910B,實測下來有點超出預期——7nm工藝下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
    發(fā)表于 10-27 13:12

    AI芯片:科技探索與AGI愿景》—— 深入硬件核心的AGI指南

    AI芯片:科技探索與AGI愿景》一書如同一張詳盡的“藏寶圖”,為讀者指明了通往下一代人工智能的硬件之路。作者沒有停留在空洞的概念層面,而是直擊核心,從馮·諾依曼架構的“內(nèi)存墻”瓶頸切入,清晰闡述了
    發(fā)表于 09-17 09:29

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    當今社會,AI已經(jīng)發(fā)展很迅速了,但是你了解AI的發(fā)展歷程嗎?本章作者將為我們打開AI的發(fā)展歷程以及需求和挑戰(zhàn)的面紗。 從2017年開始生成式AI
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內(nèi)容總覽

    ,其中第一章是概論,主要介紹大模型浪潮下AI芯片的需求與挑戰(zhàn)。第二章和第三章分別介紹實現(xiàn)深度學習AI芯片的創(chuàng)新方法和架構。以及一些新型的算法
    發(fā)表于 09-05 15:10

    【飛凌T527N開發(fā)板試用】異構RISC-V核心使用體驗

    全志T527的最大創(chuàng)新和亮點就在于其 “ARM + 異構RISC-V” 的芯片設計理念。 簡單來說, 全志T527內(nèi)置的阿里平頭哥E907 RISC-V核心不是一個可選的協(xié)處理器,而是一個深度集成
    發(fā)表于 08-19 21:45

    商湯大裝置發(fā)布基于DeepLink的異構混合調(diào)度方案

    調(diào)度復雜、跨域訓練穩(wěn)定性不足等行業(yè)挑戰(zhàn),全面提升異構集群的協(xié)同效率與運行可靠性,加速國產(chǎn)AI算力從“可用”邁向“好用”,為大模型訓練提供強大而高效的支撐能力。
    的頭像 發(fā)表于 08-05 10:01 ?1213次閱讀

    潤和軟件發(fā)布StackRUNS異構分布式推理框架

    當下,AI模型規(guī)模持續(xù)膨脹、多模態(tài)應用場景日益復雜,企業(yè)正面臨異構算力資源碎片化帶來的嚴峻挑戰(zhàn)。為應對行業(yè)痛點,江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)正式發(fā)布自主研發(fā)的StackRUNS
    的頭像 發(fā)表于 06-13 09:10 ?1583次閱讀
    潤和軟件發(fā)布StackRUNS<b class='flag-5'>異構</b>分布式推理框架

    能效提升3倍!異構計算架構讓AI跑得更快更省電

    。它是應對復雜計算需求的關鍵技術之一。 ? 異構計算架構的核心優(yōu)勢 ? 異構計算架構的核心要素主要包括多種計算單元結合、任務分配機制和協(xié)同工作機制。多種計算單元結合:結合不同類型的處理單元,如CPU、GPU、TPU、FPGA等,
    的頭像 發(fā)表于 05-25 01:55 ?4257次閱讀
    板桥市| 临泉县| 肇庆市| 昭通市| 黄大仙区| 昌吉市| 临泽县| 灵武市| 历史| 洱源县| 资中县| 定南县| 额尔古纳市| 浦东新区| 通榆县| 阿拉尔市| 读书| 叙永县| 进贤县| 望都县| 贞丰县| 丹江口市| 肥东县| 庆城县| 登封市| 建平县| 剑河县| 柳河县| 左贡县| 南通市| 永川市| 隆尧县| 明光市| 安岳县| 乌鲁木齐市| 兰考县| 青川县| 格尔木市| 平邑县| 奉节县| 白水县|