哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI推理帶火的ASIC,開發(fā)成敗在此一舉!

Hobby觀察 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:梁浩斌 ? 2025-03-03 00:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/梁浩斌)去年年底,多家大廠爆出開發(fā)數(shù)據(jù)中心ASIC芯片的消息,包括傳聞蘋果與博通合作開發(fā)面向AI推理的ASIC,亞馬遜也在年底公布了其AIASIC的應(yīng)用實例,展示出ASIC的應(yīng)用性價比遠超GPU,加上博通財報AI業(yè)務(wù)同比大增220%,掀起了AI推理端的ASIC熱潮。

那么ASIC跟傳統(tǒng)的GPU有哪些區(qū)別,開發(fā)上又有哪些流程上的不同?

ASIC和GPU

通用GPU在設(shè)計之初就為了適配更多使用場景,在AI應(yīng)用上,GPU支持訓(xùn)練、推理、通用計算等全流程,以英偉達GPU為例,通過CUDA生態(tài),英偉達GPU能夠快速適配新的算法,比如從Transformer到CNN的遷移,只需要修改30%左右的代碼。

相比通用GPU,ASIC是專為滿足特定應(yīng)用而設(shè)計的芯片,針對特定應(yīng)用的特定算法進行硬件級別的優(yōu)化,尤其在AI應(yīng)用中,比如運行矩陣乘法、張量計算等任務(wù),能夠相比GPU效率更高。

比如谷歌TPU就是一款A(yù)SIC,采用脈動陣列設(shè)計,通過固化數(shù)據(jù)流水線減少內(nèi)存訪問次數(shù),能效比達GPU的3.2倍。

相比之下GPU使用通用計算單元處理多種任務(wù),為了滿足不同類型的計算需求,必然需要存在計算冗余。

GPU由于架構(gòu)的特性,一般會在AI計算中保留圖形渲染、視頻編解碼等功能模塊,但在AI計算中這些模塊大部分處于閑置狀態(tài)。有研究指出,英偉達H100GPU上有大約15%的晶體管是未在AI計算過程中被使用的。

同時,在計算流程上,GPU在處理AI計算任務(wù)時是需要通過CUDA軟件棧進行任務(wù)調(diào)度,比如矩陣乘法的運行時需要經(jīng)過內(nèi)存加載、指令分發(fā)、TensorCore計算、結(jié)果回寫等多個步驟。

而在ASIC上,可以通過硬件級的流水線固化數(shù)據(jù)流,能夠減少計算流程步驟,提高運算效率。在減少計算流程的同時,ASIC對內(nèi)存訪問模式的優(yōu)化,還能有助于降低內(nèi)存控制器的功耗。

AI計算中,低精度是以損失部分準確率為代價,通過量化壓縮數(shù)據(jù)來提高推理速度。目前AI推理中INT8/FP16的精度,GPU一般支持FP32/FP64等高精度計算,在混合精度訓(xùn)練中,GPU還需要額外的顯存來轉(zhuǎn)換成低精度結(jié)果,同樣的芯片,在運行高精度和低精度的算力也不同。

盡管精度的選擇本質(zhì)上是準確性和效率的取舍,但AI推理等應(yīng)用中,對精度的需求并不需要極致的接近100%,但仍能保持較高的水準。ASIC一般直接支持低精度計算,在AI計算時的效率能夠相比GPU大幅提高,但保持一定的準確率。比如有數(shù)據(jù)顯示,TikTok的推薦算法系統(tǒng)采用INT8精度,但依然保持了接近99%的推薦準確率。

所以,ASIC相比GPU,在硬件架構(gòu)上可以針對專有應(yīng)用進行特定優(yōu)化,提高計算效率和降低功耗。在成本方面,ASIC在規(guī)模量產(chǎn)的情況下可以降至GPU的三分之一,但前期開發(fā)成本仍不能忽視。

可能大家也發(fā)現(xiàn),目前定制開發(fā)高算力ASIC的廠商,無一例外是云計算大廠,本身公司業(yè)務(wù)就有極大規(guī)模的算力需求。ASIC定制費用,主要是開發(fā)過程中的一次性工程費用,也被業(yè)內(nèi)稱為NRE(Non-RecurringEngineering)。顧名思義,NRE費用只需要支出一次,后續(xù)規(guī)模生產(chǎn)中不需要再增加這部分費用。

NRE費用中,包含芯片設(shè)計的成本,比如研發(fā)人員薪酬、EDA工具授權(quán)費等,這與芯片使用的制程工藝、芯片本身的復(fù)雜程度相關(guān);然后是版圖設(shè)計成本,其實這里的概念跟芯片設(shè)計的成本類似,主要是涉及芯片的物理布局設(shè)計,需要特定的研發(fā)人員和軟件支持;再是IP授權(quán)費用,一般是一些通用的IP,比如CPUIP、內(nèi)存控制器、接口IP等。

以定制一款采用5nm制程的ASIC為例,NRE費用可以高達1億至2億美元。然而一旦能夠大規(guī)模出貨,NRE費用就可以很大程度上被攤薄。

此前有業(yè)內(nèi)人士分析,中等復(fù)雜程度的ASIC盈虧平衡點在10萬片左右,這對于很多廠商來說已經(jīng)是遙不可及。

ASIC開發(fā)流程

在開發(fā)ASIC時,最關(guān)鍵的是以算法架構(gòu)為主導(dǎo),圍繞這一方面去進行其他工作。

首先是進行需求定義,要明確ASIC的目標場景是什么,比如推理還是訓(xùn)練?端側(cè)還是云端?用到CNN還是Transformer?在AI領(lǐng)域,定制ASIC的往往是云計算大廠,這些廠商一般會有頂尖的架構(gòu)師去進行充分考慮,未來可能的應(yīng)用、效率、成本、技術(shù)可行性等都會包含在內(nèi),同時平衡性能、成本、功耗等關(guān)鍵指標。當然也有一些芯片廠商推出針對某些應(yīng)用場景的ASIC產(chǎn)品。那么在前期產(chǎn)品定義就十分關(guān)鍵,有時候還需要開發(fā)針對應(yīng)用場景的算法配合自己的芯片產(chǎn)品使用。

接下來是最關(guān)鍵的算法和架構(gòu)優(yōu)化,需要對行業(yè)發(fā)展趨勢有足夠認知,選擇適合的算法進行優(yōu)化,保證算法與硬件架構(gòu)適配,通過仿真測試驗證。

然后設(shè)計ASIC的整體架構(gòu),比如功能模塊的劃分和模塊之間的互連,以及接口等IP的使用。

在前端設(shè)計中,使用VHDL或Verilog等硬件描述語言對設(shè)計進行編碼,然后將編碼轉(zhuǎn)換為門級網(wǎng)表,對其進行優(yōu)化滿足芯片面積和性能要求。

進入后端設(shè)計后,需要將門級網(wǎng)表映射到具體的芯片物理結(jié)構(gòu)上,進行布局和布線。

完成模塊布局和布線后,就可以開始進行FPGA驗證,測試ASIC設(shè)計的功能是否滿足需求。隨后完成流片、測試后就可以投入大規(guī)模生產(chǎn)。

總的來說,ASIC的開發(fā)中,硬件和軟件的協(xié)同是其成功的關(guān)鍵,在擁有強大的芯片性能同時,還要筑建完整的軟件生態(tài),吸引更多用戶使用。

當然,在ASIC量產(chǎn)進入市場后,軟件棧開發(fā)也是相當重要的,需要編譯器將TensorFlow和PyTorch等機器學(xué)習(xí)模型映射到硬件指令上,在生態(tài)上也需要支持更多主流的框架,以盡可能滿足更多使用需求。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • asic
    +關(guān)注

    關(guān)注

    34

    文章

    1277

    瀏覽量

    124926
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40908

    瀏覽量

    302486
  • 芯片開發(fā)
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    2664
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V2-FAS)

    模型推理指南 17分03秒 https://t.elecfans.com/v/28540.html *附件:文檔:Fibo AI Stack模型推理指南----基于SC171開發(fā)套件V
    發(fā)表于 02-11 11:44

    使用NORDIC AI的好處

    × 在 CPU 上運行時可快 10×、更省電,平均模型體積 <5 KB。[Edge AI 軟件頁] Axon NPU 對同 TensorFlow Lite 模型:* 推理速度最高可比
    發(fā)表于 01-31 23:16

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版

    AI端側(cè)部署開發(fā)(SC171開發(fā)套件V3)2026版 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉(zhuǎn)化指南 27分19秒 http
    發(fā)表于 01-15 10:31

    海信一舉斬獲CES 2026四項創(chuàng)新獎項

    在備受矚目的CES2026國際消費電子展上,海信憑借系列突破性前沿技術(shù)創(chuàng)新,一舉斬獲四項CES創(chuàng)新獎項。從再次實現(xiàn)代際引領(lǐng)的全新代RGB-Mini LED顯示技術(shù)到全球首款四基色Micro
    的頭像 發(fā)表于 01-08 15:57 ?362次閱讀

    偉創(chuàng)力一舉斬獲四項重量級大獎

    偉創(chuàng)力福永(福海)/福田和偉創(chuàng)力固戍團隊在 2025 年全國(深圳)優(yōu)秀外商投資企業(yè)表彰中一舉斬獲四項重量級大獎,彰顯強勁的發(fā)展實力與優(yōu)秀的運營表現(xiàn)。
    的頭像 發(fā)表于 01-08 15:22 ?499次閱讀

    富瀚微電子一舉斬獲兩項重磅榮譽

    2025年12月18日,由全球安防行業(yè)權(quán)威媒體《a&s安全自動化》主辦的2025全球安全產(chǎn)業(yè)數(shù)字化創(chuàng)新榜評選結(jié)果正式揭曉。上海富瀚微電子股份有限公司憑借在智能視覺芯片領(lǐng)域的持續(xù)創(chuàng)新與卓越貢獻,一舉斬獲兩項重磅榮譽。
    的頭像 發(fā)表于 12-29 16:48 ?443次閱讀
    富瀚微電子<b class='flag-5'>一舉</b>斬獲兩項重磅榮譽

    榮耀加冕 · 實力見證 | 千視一舉斬獲二項DAV年度大獎

    近日,在備受矚目的"2025年度DAV數(shù)字音視工程網(wǎng)第十七屆年度品牌評選"中,千視電子憑借扎實的技術(shù)積累和系統(tǒng)性的解決方案能力,一舉斬獲"優(yōu)秀行業(yè)解決方案獎"
    的頭像 發(fā)表于 12-29 15:58 ?917次閱讀
    榮耀加冕 · 實力見證 | 千視<b class='flag-5'>一舉</b>斬獲二項DAV年度大獎

    全球首發(fā)!SensorMicro芯微電子8微米產(chǎn)品通過AEC-Q100認證

    全球知名檢驗檢測認證機構(gòu)——TüV德國萊茵發(fā)函確認:基于芯微電子640×512/8微米紅外探測器開發(fā)的車載紅外芯片(KP608W)一舉通過AEC-Q100認證!這也意味著我們的8微米產(chǎn)品向著汽車產(chǎn)業(yè)邁出了堅實的
    的頭像 發(fā)表于 12-29 10:41 ?771次閱讀
    全球首發(fā)!SensorMicro芯<b class='flag-5'>火</b>微電子8微米產(chǎn)品通過AEC-Q100認證

    博世中國一舉斬獲兩大重要獎項

    12月11日,中國歐盟商會 2025 年可持續(xù)商業(yè)獎頒獎典禮在上海舉行。博世中國憑借在綠色制造及社區(qū)共創(chuàng)兩大領(lǐng)域的持續(xù)深耕,一舉斬獲兩大重要獎項。
    的頭像 發(fā)表于 12-22 15:06 ?662次閱讀

    博聯(lián)智能一舉斬獲兩項行業(yè)權(quán)威大獎

    )憑借其在智能家居領(lǐng)域持續(xù)的技術(shù)突破、成熟的產(chǎn)品生態(tài)與廣泛的市場影響力,一舉斬獲慧聰網(wǎng)“智能家居領(lǐng)軍品牌”及千家智客“十大全屋智能品牌獎”兩項行業(yè)權(quán)威大獎。
    的頭像 發(fā)表于 12-19 17:28 ?1118次閱讀

    宏微科技一舉斬獲兩項重磅行業(yè)大獎

    聚力創(chuàng)新動能,破局產(chǎn)業(yè)難題,領(lǐng)航技術(shù)前沿!近期深圳半導(dǎo)體與電源技術(shù)領(lǐng)域盛會密集,宏微科技攜旗下子公司上海宏微愛賽半導(dǎo)體有限公司(以下簡稱“宏微愛賽”)強勢亮相。憑借突出的技術(shù)實力與產(chǎn)品性能,宏微科技一舉斬獲兩項重磅行業(yè)大獎,成為會場焦點!
    的頭像 發(fā)表于 12-19 17:22 ?972次閱讀
    宏微科技<b class='flag-5'>一舉</b>斬獲兩項重磅行業(yè)大獎

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    的工作嗎? 從書中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。 其他的還是知道的,F(xiàn)PGA屬于AI芯片這個真不知道,以為它是數(shù)字芯片的,不曉得屬于
    發(fā)表于 09-12 16:07

    華為亮相2025金融AI推理應(yīng)用落地與發(fā)展論壇

    近日,2025金融AI推理應(yīng)用落地與發(fā)展論壇在上海舉行。中國銀聯(lián)執(zhí)行副總裁涂曉軍、華為數(shù)字金融軍團CEO曹沖出席本次論壇并發(fā)表致辭。論壇上,華為公司副總裁、數(shù)據(jù)存儲產(chǎn)品線總裁周躍峰博士發(fā)布AI
    的頭像 發(fā)表于 08-15 09:45 ?1368次閱讀

    AI芯片,需要ASIC

    電子發(fā)燒友網(wǎng)報道(文/李彎彎) 2025年,全球AI芯片市場正迎來場結(jié)構(gòu)性變革。在英偉達GPU占據(jù)主導(dǎo)地位的大格局下,ASIC(專用集成電路)憑借針對AI任務(wù)的定制化設(shè)計,成為推動算
    的頭像 發(fā)表于 07-26 07:30 ?7313次閱讀

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開發(fā)的新AI大模型。其核心優(yōu)勢
    發(fā)表于 07-16 15:29
    楚雄市| 南郑县| 曲周县| 灵石县| 哈尔滨市| 宁化县| 金山区| 迁安市| 碌曲县| 遵义县| 怀化市| 大余县| 隆尧县| 雅江县| 固镇县| 庆城县| 石首市| 五原县| 永仁县| 响水县| 乌恰县| 周宁县| 敦煌市| 太仓市| 镇坪县| 饶河县| 堆龙德庆县| 灵璧县| 堆龙德庆县| 鹰潭市| 建水县| 拜泉县| 安仁县| 格尔木市| 万安县| 色达县| 台东市| 淮南市| 永州市| 且末县| 巨鹿县|