哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

進(jìn)迭時(shí)空同構(gòu)融合技術(shù)加速大模型AI應(yīng)用創(chuàng)新

進(jìn)迭時(shí)空 ? 2025-06-06 16:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

同構(gòu)融合技術(shù)


為了加速AI計(jì)算,芯片企業(yè)設(shè)計(jì)了多種專(zhuān)用處理器架構(gòu),如GPGPU、NPU、TPU等。這些專(zhuān)用處理器架構(gòu)在執(zhí)行調(diào)度代碼及應(yīng)用層代碼時(shí),需要主控CPU的配合,如下圖所示。因此,通常需要構(gòu)建復(fù)雜的異構(gòu)調(diào)度系統(tǒng)來(lái)協(xié)調(diào)CPU和XPU的額外數(shù)據(jù)交互和同步。


進(jìn)迭時(shí)空踐行的同構(gòu)融合技術(shù),創(chuàng)新性地在CPU內(nèi)集成TensorCore,以RISC-V指令集為統(tǒng)一的軟硬件接口,驅(qū)動(dòng)Scalar標(biāo)量算力、Vector向量算力和 Matrix AI算力,支持軟件和AI模型同時(shí)在RISC-V AI核上運(yùn)行,并通過(guò)程序正常跳轉(zhuǎn)實(shí)現(xiàn)軟件和AI模型之間的事件和數(shù)據(jù)交互,進(jìn)而完成整個(gè)AI應(yīng)用執(zhí)行。我們將這種使用同構(gòu)融合技術(shù),得到具有AI算力的CPU稱(chēng)為AI CPU。


f223d4dc-42b3-11f0-986f-92fbcf53809c.png



同構(gòu)融合技術(shù)以更輕的軟件基礎(chǔ)設(shè)施構(gòu)建接近Nvidia的軟件層級(jí)


雖然市面上已有多種不同架構(gòu)且硬件做的非常出色的AI加速器,但是除了AIOT細(xì)分場(chǎng)景之外,Nvidia占據(jù)了AI計(jì)算絕大多數(shù)市場(chǎng)份額,成為AI計(jì)算主流架構(gòu),并深刻影響工業(yè)界學(xué)術(shù)界AI計(jì)算的發(fā)展。Nvidia通過(guò)CUDA將異構(gòu)開(kāi)發(fā)的門(mén)檻降至最低,并基于多層級(jí)的軟件棧構(gòu)建了護(hù)城河?;谶@些軟件棧,全球開(kāi)發(fā)者都在壯大Nvidia生態(tài)。很多企業(yè)的GPGPU發(fā)展策略是硬件上學(xué)習(xí)Nvidia,軟件上兼容CUDA生態(tài)。由于很難跟上Nvidia的快速迭代,這條路徑并不容易實(shí)現(xiàn)。


同構(gòu)融合有望成為新的發(fā)展路徑。相比于異構(gòu)加速器和CPU的組合,同構(gòu)融合技術(shù)在硬件層面上對(duì)AI算力和通用CPU進(jìn)行了更高層次的封裝,用戶(hù)不需要關(guān)心主控CPU和異構(gòu)加速器之間的數(shù)據(jù)同步,并且保留了通用CPU的調(diào)試和開(kāi)發(fā)方式。廠商不需要開(kāi)發(fā)復(fù)雜的異構(gòu)調(diào)度系統(tǒng),也不需要開(kāi)發(fā)額外的驅(qū)動(dòng)管理就可以讓開(kāi)發(fā)者便捷的使用AI算力。另外,同構(gòu)融合技術(shù)中CPU的通用性和RISC-V架構(gòu)良好的開(kāi)源生態(tài)基礎(chǔ),進(jìn)一步降低了需要自建軟件棧的復(fù)雜度。


綜上,進(jìn)迭時(shí)空基于開(kāi)源軟件生態(tài),以更輕的基礎(chǔ)軟件設(shè)施,構(gòu)建了接近Nvidia的軟件層級(jí),如下圖所示。我們的目標(biāo)是,基于這些軟件層級(jí),達(dá)到接近Nvidia的AI通用性。


f235c71e-42b3-11f0-986f-92fbcf53809c.jpg


1

在模型加速層面,與Nvidia一樣,進(jìn)迭時(shí)空的推理引擎可以非常便捷的接入各主流第三方框架

2

在Tensor及多維數(shù)據(jù)塊層面,SpineDNN、SpineTriton及SpineJit分別對(duì)標(biāo)CUDNN、CUTLASS及CUTE

3

在Scalar及Vector層面,SpineDPC++可以對(duì)標(biāo)CUDA

4

最底層的寄存器層面,標(biāo)準(zhǔn)的Intrinsic接口則對(duì)標(biāo)Nvidia的PTX接口



進(jìn)迭時(shí)空同構(gòu)融合技術(shù)實(shí)踐


進(jìn)迭時(shí)空基于同構(gòu)融合技術(shù)完成兩代通用RISC-V AI核的研發(fā)。


第一代RISC-V AI核A60實(shí)現(xiàn)2Tops算力,支持INT8等數(shù)據(jù)格式。A60核已經(jīng)應(yīng)用于RISC-V AI CPU芯片K1,實(shí)踐表明,同構(gòu)融合AI算力可以無(wú)縫運(yùn)行所有AI算法,更安全地加速?gòu)腡EE到REE所有AI應(yīng)用。RISC-V AI CPU芯片K1也是第一個(gè)完整提供Scalar、Vector和Matrix三個(gè)維度關(guān)鍵算力的RISC-V芯片。在運(yùn)行常見(jiàn)的AI算法時(shí),K1的實(shí)際性能是傳統(tǒng)芯片的3-5倍,某些AI應(yīng)用幀率提升可達(dá)10倍以上。


尤其是在運(yùn)行大模型算法時(shí),Matrix算力可以從容應(yīng)對(duì)prefill階段的算力需求,CPU出色的訪存系統(tǒng)可以解決decode階段的帶寬需求,無(wú)需構(gòu)建復(fù)雜的異構(gòu)計(jì)算調(diào)度系統(tǒng)。此外,由于CPU的通用性,可以支持幾乎所有低bit量化方式,將帶寬需求降至最低。


更重要的是,將整個(gè)AI應(yīng)用涉及的計(jì)算步驟全部遷移至AI CPU上,還可以為客戶(hù)提供更加簡(jiǎn)單高效的開(kāi)發(fā)方式。不僅能夠避免在多個(gè)硬件設(shè)備上開(kāi)發(fā)和調(diào)試,而且在一個(gè)編程模型覆蓋AI開(kāi)發(fā)全過(guò)程,能夠讓部署和調(diào)試變得輕松,讓算法快速實(shí)現(xiàn)價(jià)值。例如,K1芯片在客戶(hù)場(chǎng)景下,可以把在傳統(tǒng)NPU上適配新算法所需的3-6個(gè)月時(shí)間壓縮到1周以?xún)?nèi),K1芯片已支持多個(gè)客戶(hù)在語(yǔ)音和機(jī)器視覺(jué)領(lǐng)域快速開(kāi)發(fā)了基于最新AI大模型的產(chǎn)品。


第二代RISC-V AI核A100已經(jīng)研發(fā)完畢,預(yù)期無(wú)論在大模型運(yùn)行效率方面,還是運(yùn)行傳統(tǒng)AI效率方面都能達(dá)到業(yè)界先進(jìn)水平。


此外在算力堆疊方面,同構(gòu)融合技術(shù)路線通過(guò)采用Core-to-Core coherence和Cluster-to-Cluster coherence,能以與GPU相同的技術(shù)實(shí)現(xiàn)多芯片級(jí)聯(lián)和算力堆疊。與總線的Die2Die一致性技術(shù)結(jié)合后,通往多芯片算力堆疊的規(guī)模有望接近現(xiàn)有最先進(jìn)GPU集群。



同構(gòu)融合技術(shù)適合運(yùn)行MoE大模型


MOE模型(Mixture of Experts,混合專(zhuān)家模型)是一種基于分而治之策略的神經(jīng)網(wǎng)絡(luò)架構(gòu),它將復(fù)雜的問(wèn)題分解為多個(gè)子問(wèn)題,每個(gè)子問(wèn)題由一個(gè)獨(dú)立的模型(稱(chēng)為專(zhuān)家)進(jìn)行處理。MOE模型在單請(qǐng)求推理場(chǎng)景,每個(gè)token只需要使用部分專(zhuān)家參與計(jì)算。這些專(zhuān)家共同組成了MOE模型的激活參數(shù)。以DeepSeek-R1模型為例,671B的模型,只有37B的激活參數(shù)。對(duì)于FP8的模型,相當(dāng)于需要將近700GB的容量來(lái)存放模型所有的權(quán)重,但是在進(jìn)行單請(qǐng)求推理時(shí),每個(gè)token只需要使用將近40GB的權(quán)重。相比于Dense模型,MOE模型是一個(gè)大容量,弱帶寬的推理需求。相較于GDDR和HBM,內(nèi)存容量更容易擴(kuò)展;再加上專(zhuān)家的選擇是動(dòng)態(tài)的,其計(jì)算和訪存模式是CPU極其擅長(zhǎng)的。


GPU與NPU適合密集的重復(fù)計(jì)算模式,而CPU適合復(fù)雜調(diào)度場(chǎng)景下的計(jì)算模式,AI CPU介于兩者之間。MoE的興起,代表了一個(gè)兼具大容量與復(fù)雜邏輯的大模型發(fā)展趨勢(shì),而這正是AI CPU的發(fā)力場(chǎng)景。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40820

    瀏覽量

    302429
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3738

    瀏覽量

    5263
  • 進(jìn)迭時(shí)空
    +關(guān)注

    關(guān)注

    0

    文章

    65

    瀏覽量

    617
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    進(jìn)時(shí)空發(fā)布新一代RISC-V AI CPU芯片,滿(mǎn)足端側(cè)大模型算力需求

    電子發(fā)燒友網(wǎng)報(bào)道 1月29日,進(jìn)時(shí)空線上發(fā)布新一代AI CPU芯片——K3。作為全球首顆符合RVA23規(guī)范的量產(chǎn)RISC-V芯片,K3實(shí)現(xiàn)多項(xiàng)技術(shù)
    的頭像 發(fā)表于 01-30 14:06 ?9399次閱讀

    進(jìn)時(shí)空再獲數(shù)億元融資,下一代 RISC-V AI 芯片 K3 即將發(fā)布

    進(jìn)時(shí)空再獲數(shù)億元融資,下一代 RISC-V AI 芯片 K3 即將發(fā)布
    的頭像 發(fā)表于 01-15 19:07 ?542次閱讀
    <b class='flag-5'>進(jìn)</b><b class='flag-5'>迭</b><b class='flag-5'>時(shí)空</b>再獲數(shù)億元融資,下一代 RISC-V <b class='flag-5'>AI</b> 芯片  K3 即將發(fā)布

    進(jìn)時(shí)空2025年度十大開(kāi)發(fā)者揭曉

    回顧2025,RISC-V與AI融合持續(xù)深化,推動(dòng)智能計(jì)算進(jìn)入更開(kāi)放、更高效的新階段。在人工智能發(fā)展的浪潮中,廣大開(kāi)發(fā)者始終與進(jìn)時(shí)空并肩
    的頭像 發(fā)表于 01-12 20:07 ?763次閱讀
    <b class='flag-5'>進(jìn)</b><b class='flag-5'>迭</b><b class='flag-5'>時(shí)空</b>2025年度十大開(kāi)發(fā)者揭曉

    聚勢(shì)前行,攜手共進(jìn)|進(jìn)時(shí)空亮相 ICCAD-Expo 2025

    11月20日至21日,2025集成電路發(fā)展論壇(成渝)暨第三十一屆集成電路設(shè)計(jì)業(yè)展覽會(huì)(ICCAD-Expo2025)在成都西博城隆重舉行。進(jìn)時(shí)空作為RISC-V領(lǐng)域的重要創(chuàng)新力量受
    的頭像 發(fā)表于 11-22 09:04 ?1121次閱讀
    聚勢(shì)前行,攜手共進(jìn)|<b class='flag-5'>進(jìn)</b><b class='flag-5'>迭</b><b class='flag-5'>時(shí)空</b>亮相 ICCAD-Expo 2025

    進(jìn)時(shí)空雙周報(bào)(20251022-1121)

    = \"okay\"; } 軟件與系統(tǒng) 【 問(wèn)題 】請(qǐng)問(wèn)一下進(jìn)時(shí)空的 K1 芯片,目前有支持 RTOS 嗎?我想在 K1 上跑 RTOS,但在網(wǎng)上沒(méi)找到相關(guān)的開(kāi)發(fā)包。請(qǐng)問(wèn)官方有提供
    發(fā)表于 11-21 17:34

    芯聚成都 | 進(jìn)時(shí)空邀您共赴 ICCAD-Expo 2025

    芯聚成都 | 進(jìn)時(shí)空邀您共赴 ICCAD-Expo 2025
    的頭像 發(fā)表于 11-14 18:02 ?3790次閱讀
    芯聚成都 | <b class='flag-5'>進(jìn)</b><b class='flag-5'>迭</b><b class='flag-5'>時(shí)空</b>邀您共赴 ICCAD-Expo 2025

    取之于開(kāi)源,貢獻(xiàn)于開(kāi)源:進(jìn)時(shí)空AI計(jì)算生態(tài)開(kāi)源貢獻(xiàn)

    開(kāi)放創(chuàng)新進(jìn)時(shí)空的企業(yè)價(jià)值觀之一,公司的軟硬件技術(shù)棧構(gòu)建在開(kāi)源之上,同時(shí)也積極在操作系統(tǒng)、編譯器、AI
    的頭像 發(fā)表于 10-21 09:03 ?5957次閱讀
    取之于開(kāi)源,貢獻(xiàn)于開(kāi)源:<b class='flag-5'>進(jìn)</b><b class='flag-5'>迭</b><b class='flag-5'>時(shí)空</b><b class='flag-5'>AI</b>計(jì)算生態(tài)開(kāi)源貢獻(xiàn)

    十萬(wàn)元獎(jiǎng)金池!首屆全國(guó)RISC-V高水平創(chuàng)新及應(yīng)用大賽火熱進(jìn)行中

    終端需融合多模態(tài)感知與決策能力,但面臨異構(gòu)計(jì)算資源緊張、多模型協(xié)同效率低等挑戰(zhàn)。本賽題要求基于進(jìn)時(shí)空RISC-V
    發(fā)表于 09-25 13:56

    校園招聘 | 進(jìn)時(shí)空2026校園招募令

    校園招聘 | 進(jìn)時(shí)空2026校園招募令
    的頭像 發(fā)表于 09-11 09:05 ?943次閱讀
    校園招聘 | <b class='flag-5'>進(jìn)</b><b class='flag-5'>迭</b><b class='flag-5'>時(shí)空</b>2026校園招募令

    進(jìn)時(shí)空與青少年共赴RISC-V AI科技未來(lái)!

    8月15日至25日,首屆烏鎮(zhèn)青少年科技嘉年華圓滿(mǎn)落幕。進(jìn)時(shí)空受邀亮相世界互聯(lián)網(wǎng)科技館"烏鎮(zhèn)硅谷"體驗(yàn)區(qū),展示了多款基于K1芯片的智能產(chǎn)品,為青少年帶來(lái)沉浸式的RISC-V與AI
    的頭像 發(fā)表于 08-28 17:53 ?1477次閱讀
    <b class='flag-5'>進(jìn)</b><b class='flag-5'>迭</b><b class='flag-5'>時(shí)空</b>與青少年共赴RISC-V <b class='flag-5'>AI</b>科技未來(lái)!

    芯活力,搏未來(lái)——2025進(jìn)時(shí)空應(yīng)屆生入職培訓(xùn)

    為助力應(yīng)屆新員工快速融入公司文化、提升團(tuán)隊(duì)協(xié)作能力,進(jìn)時(shí)空精心策劃了“芯活力,搏未來(lái)”2025應(yīng)屆生入職培訓(xùn)。本次培訓(xùn)以“學(xué)習(xí)+體驗(yàn)+成長(zhǎng)”為核心,采用“室內(nèi)課程+戶(hù)外拓展”的形式,讓新芯們?cè)诨?dòng)
    的頭像 發(fā)表于 08-06 16:42 ?2134次閱讀
    芯活力,搏未來(lái)——2025<b class='flag-5'>進(jìn)</b><b class='flag-5'>迭</b><b class='flag-5'>時(shí)空</b>應(yīng)屆生入職培訓(xùn)

    迎接泛機(jī)器人時(shí)代:進(jìn)時(shí)空如何以RISC-V架構(gòu)數(shù)智未來(lái)

    21世紀(jì)經(jīng)濟(jì)報(bào)道記者趙娜杭州報(bào)道“這是我們的時(shí)代?!苯衲?月的一天,21世紀(jì)經(jīng)濟(jì)報(bào)道記者來(lái)到進(jìn)時(shí)空杭州總部。進(jìn)
    的頭像 發(fā)表于 06-06 17:00 ?1279次閱讀
    迎接泛機(jī)器人時(shí)代:<b class='flag-5'>進(jìn)</b><b class='flag-5'>迭</b><b class='flag-5'>時(shí)空</b>如何以RISC-V架構(gòu)數(shù)智未來(lái)

    高校賽事 | 進(jìn)時(shí)空攜手藍(lán)橋杯,誠(chéng)邀全國(guó)高校學(xué)子共啟RISC-V人工智能應(yīng)用創(chuàng)新賽道

    以下文章來(lái)源于RISC-V先鋒,作者進(jìn)時(shí)空2025年5月12日,第十六屆藍(lán)橋杯數(shù)字科技創(chuàng)新(RISC-V應(yīng)用創(chuàng)新)命題賽正式啟動(dòng)。本次大賽
    的頭像 發(fā)表于 06-06 16:55 ?2051次閱讀
    高校賽事 | <b class='flag-5'>進(jìn)</b><b class='flag-5'>迭</b><b class='flag-5'>時(shí)空</b>攜手藍(lán)橋杯,誠(chéng)邀全國(guó)高校學(xué)子共啟RISC-V人工智能應(yīng)用<b class='flag-5'>創(chuàng)新</b>賽道

    大象機(jī)器人攜手進(jìn)時(shí)空推出 RISC-V 全棧開(kāi)源六軸機(jī)械臂產(chǎn)品

    全球80多個(gè)國(guó)家和地區(qū)。 近日,大象機(jī)器人聯(lián)合進(jìn)時(shí)空推出全球首款RISC-V全棧開(kāi)源六軸機(jī)器臂“myCobot 280 RISC-V”,為開(kāi)發(fā)者打造全新的機(jī)器人開(kāi)源創(chuàng)新平臺(tái)。 “my
    發(fā)表于 04-25 17:59

    大象機(jī)器人×進(jìn)時(shí)空聯(lián)合發(fā)布全球首款RISC-V全棧開(kāi)源小六軸機(jī)械臂

    ? ? 在全球AI與機(jī)器人技術(shù)高速發(fā)展的浪潮中,中國(guó)公司始終堅(jiān)定走在自研創(chuàng)新的道路上。 ? ? 4月25日,大象機(jī)器人與 國(guó)內(nèi)RISC-V AI CPU芯片領(lǐng)軍企業(yè)【
    的頭像 發(fā)表于 04-25 14:19 ?1947次閱讀
    大象機(jī)器人×<b class='flag-5'>進(jìn)</b><b class='flag-5'>迭</b><b class='flag-5'>時(shí)空</b>聯(lián)合發(fā)布全球首款RISC-V全棧開(kāi)源小六軸機(jī)械臂
    隆昌县| 大石桥市| 黄大仙区| 延庆县| 博乐市| 平塘县| 林芝县| 仁化县| 济南市| 临猗县| 罗平县| 鹰潭市| 贞丰县| 安丘市| 手游| 潮州市| 西丰县| 彝良县| 光泽县| 台北县| 阿城市| 凯里市| 都安| 永顺县| 伊宁县| 张北县| 襄城县| 寿阳县| 衡山县| 根河市| 河南省| 宾川县| 双辽市| 乌恰县| 余干县| 博白县| 巴中市| 渑池县| 南阳市| 舞钢市| 定南县|