哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么FPGA主頻比CPU慢,但卻可以用來幫CPU做加速

電子工程師 ? 來源:FPGA技術(shù)江湖 ? 作者:EDN電子技術(shù)設(shè)計(jì) ? 2020-11-20 09:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我們知道,FPGA的頻率一般只有幾百M(fèi)Hz,而CPU的頻率卻高達(dá)數(shù)GHz。那么,有不少網(wǎng)友心中就有一個(gè)疑問:“為什么FPGA主頻比CPU慢,但卻可以用來幫CPU做加速?”。

今天,EDN就和大家系統(tǒng)性地討論下這個(gè)問題。

將FPGA主頻與CPU相比不妥

在開始之前,首先要明確一點(diǎn),將FPGA的主頻與CPU比較,實(shí)際是風(fēng)馬牛不相及的問題。FPGA和CPU是兩種完全不同的器件,前者是專用,是硬件編程,而后者是通用,是軟件編程。

不同體系結(jié)構(gòu)性能和靈活性的比較。(圖片來源:《如何評(píng)價(jià)微軟在數(shù)據(jù)中心使用 FPGA 代替?zhèn)鹘y(tǒng) CPU 的做法?》)

表面上看,F(xiàn)PGA的時(shí)鐘頻率要低;對(duì)于通用計(jì)算任務(wù),F(xiàn)PGA設(shè)計(jì)貌似不如CPU設(shè)計(jì)。但是實(shí)際上,單個(gè)FPGA的并行度卻比CPU要高得多。FPGA的行為是確定性的,用作硬件加速器沒有時(shí)間片、線程或資源沖突的問題。它始終以完全相同的速度執(zhí)行一件事。因此,如果需要低延遲,那么FPGA就可能是最佳選擇。

計(jì)算密集型任務(wù),CPU、GPU、FPGA、ASIC 的數(shù)量級(jí)比較(以16位整數(shù)乘法為例,數(shù)字僅為數(shù)量級(jí)的估計(jì))(圖片來源:《如何評(píng)價(jià)微軟在數(shù)據(jù)中心使用 FPGA 代替?zhèn)鹘y(tǒng) CPU 的做法?》)

FPGA并行計(jì)算機(jī)制

如知乎網(wǎng)友young cc所言,雖然CPU主頻很高,但其是通用處理器,做某個(gè)特定運(yùn)算(如信號(hào)處理,圖像處理)可能需要很多個(gè)時(shí)鐘周期。而FPGA可以通過編程重組電路,直接生成專用電路。加上電路并行性,可能做這個(gè)特定運(yùn)算只需要一個(gè)時(shí)鐘周期。

舉例來說,CPU主頻為3GHz,F(xiàn)PGA主頻為200MHz。若做某個(gè)特定運(yùn)算,CPU需要30個(gè)時(shí)鐘周期,而FPGA只需一個(gè),那么耗時(shí)情況是:

CPU:30/3GHz =10ns;

FPGA:1/200MHz =5ns。

可以看到,F(xiàn)PGA做這個(gè)特定運(yùn)算速度比CPU快,能幫助加速。

另外,CPU的主頻是加過流水線之后的。比如是15級(jí)流水線,則第一條指令執(zhí)行了15個(gè)時(shí)鐘周期后才能出結(jié)果。

但是,使用FPGA也不一定總能做加速。

例如,知乎網(wǎng)友Evan172就表示,使用FPGA做加速,只是在某些強(qiáng)計(jì)算和數(shù)據(jù)處理的方面,因?yàn)槠溆布娐凡⑿羞\(yùn)行和有很多DSP硬核資源供調(diào)用的特點(diǎn),可以工作得更出色。

FPGA本身也只是輔助角色,做控制的還是CPU本身,所以FPGA并不能代替CPU,只是在完成一件大任務(wù)的過程中將某部分任務(wù)分解給FPGA可以更好地一起完成任務(wù)。在這過程中也會(huì)有額外的開銷產(chǎn)生,在某些場合,可能用了FPGA而效果更差也是有的。

另外,通常說的使用FPGA加速比CPU和GPU省電,是指在完成同樣的任務(wù)下,F(xiàn)PGA耗費(fèi)的電力比起CPU和GPU更少一些。這是相對(duì)而言的,并不是說FPGA本身就一定省電。

一個(gè)有趣的例子:數(shù)組加法計(jì)算

知乎用戶doing舉了一個(gè)很有趣的例子。他指出,假設(shè)用FPGA完整實(shí)現(xiàn)了CPU,然后再跑軟件的話,的確比CPU慢。問題是FPGA不會(huì)那么干,它會(huì)直指問題本質(zhì),解決問題。

例如,有兩個(gè)數(shù)組,其中有256個(gè)32位數(shù)?,F(xiàn)在要把它們對(duì)應(yīng)相加變成一個(gè)數(shù)組,用CPU寫最快大概是這個(gè)樣子:

r[0] = a[0] + b[0];

r[1] = a[1] + b[1];

...

r[255] = a[255] + b[255];

當(dāng)然也可能會(huì)這么寫(在分支預(yù)測(cè)準(zhǔn)確,指令緩存不大的情況下可能更快):

for (int i = 0; i < 255; i++)

r[i] = a[i] + b[i];

對(duì)FPGA來說,也可以用上面相同的寫法,不同在于:

CPU是一個(gè)一個(gè)加法計(jì)算,而FPGA排好邏輯電路,在一個(gè)時(shí)鐘周期內(nèi)計(jì)算完畢。就算CPU主頻比FPGA快100倍也趕不上啊。話說后來CPU大量的增加SIMD指令,就有點(diǎn)這個(gè)意思,不過這相當(dāng)于提供庫函數(shù),沒那么靈活。

FPGA并行是真并行,CPU完全沒得比。CPU如果想并行最多也就是讓多個(gè)核并行,但是對(duì)于大部分算法實(shí)現(xiàn)來說,如上例,多個(gè)核之間的同步調(diào)度開銷遠(yuǎn)遠(yuǎn)大于計(jì)算開銷,就算多個(gè)核之間的調(diào)用開銷可以做的很小,一般CPU也就那幾個(gè)核,而FPGA只要門足夠,想并行幾路就可以并行幾路。

所以在做可并行的計(jì)算密集型任務(wù)時(shí),比如信號(hào)處理,網(wǎng)絡(luò)傳輸?shù)鹊菷PGA可以幫上忙;但是如果做常見的以串行為主的任務(wù),F(xiàn)PGA的確遠(yuǎn)遠(yuǎn)比不上CPU。如果要類比的話,有點(diǎn)像似GPU和CPU之間的關(guān)系。

“當(dāng)年寫Verilog的時(shí)候,我就想如果CPU里面自帶一塊FPGA,應(yīng)用程序程序可以在初始化期間直接燒一段代碼下去,那豈不是很爽。后來,有了能寫shader的3D顯卡...”

為什么FPGA成為數(shù)據(jù)中心尖端技術(shù)?

最后再討論一個(gè)話題,就是為什么FPGA一直是數(shù)據(jù)中心領(lǐng)域最尖端的技術(shù)?

有人可能認(rèn)為,再大的問題(算力)都可以通過堆CPU核心來解決。那么,假設(shè)有一臺(tái)強(qiáng)大的48核服務(wù)器,即使使用非常高端的FPGA,也很難達(dá)到相同的吞吐量。而且,F(xiàn)PGA硬件設(shè)計(jì)還需要由強(qiáng)大的團(tuán)隊(duì)來完成,非常燒錢。

這時(shí),如果把機(jī)會(huì)成本和能源效率兩者考慮進(jìn)去,好處就開始顯現(xiàn)出來了。

首先來看能源效率。假設(shè)這臺(tái)48核服務(wù)器的功耗為400W并且發(fā)熱嚴(yán)重,那么就會(huì)對(duì)數(shù)據(jù)中心運(yùn)營不利——能耗和散熱是數(shù)據(jù)中心運(yùn)營的兩項(xiàng)最大支出。而將FPGA連接起來只執(zhí)行一項(xiàng)任務(wù),就可以實(shí)現(xiàn)很高的能效而開銷極低。通過正確的設(shè)計(jì),可以在實(shí)現(xiàn)低功耗的同時(shí)獲得高吞吐量。

其次,機(jī)會(huì)成本(這個(gè)問題不太明顯)。系統(tǒng)中的CPU內(nèi)核數(shù)量就那么多。購買新的內(nèi)核并且安裝需要花很長時(shí)間,而且最好是將通用CPU內(nèi)核保留用于通用任務(wù)(例如虛擬機(jī)訂閱)。每個(gè)CPU核賣不出去就會(huì)燒錢。

當(dāng)有任務(wù)大量占用CPU時(shí)間(例如AI推理)時(shí),F(xiàn)PGA就成為了不錯(cuò)的選擇。

一個(gè)有關(guān)微軟Project Catapult項(xiàng)目當(dāng)中FPGA的趣事

當(dāng)年,微軟必應(yīng)團(tuán)隊(duì)在其Project Catapult項(xiàng)目中發(fā)現(xiàn),在啟用FPGA時(shí),CPU的總體利用率實(shí)際上略有上升。所有的人都感到困惑,因?yàn)閺闹庇X來看FPGA應(yīng)該要減少CPU負(fù)載。但是后來他們發(fā)現(xiàn),數(shù)據(jù)中心的業(yè)務(wù)流量達(dá)到了原來的2倍!由于效率提高,流量實(shí)現(xiàn)了兩倍的負(fù)載均衡。由此可見FPGA的強(qiáng)大之處。

結(jié)語

維基百科的相關(guān)詞條提到兩點(diǎn):FPGA的優(yōu)勢(shì)在于其并行特性,有時(shí)對(duì)于某些應(yīng)用而言可以使速度明顯變快;可以使用FPGA來對(duì)算法中的某些部分加速,也可以在FPGA和通用處理器之間共享部分計(jì)算。

綜上,F(xiàn)PGA有兩個(gè)優(yōu)點(diǎn):FPGA并行度遠(yuǎn)超CPU;CPU是通用電路,F(xiàn)PGA是定制電路。但是也有兩個(gè)缺點(diǎn):開發(fā)周期長;并不是所有東西都適合FPGA。

責(zé)任編輯:xj

原文標(biāo)題:為什么FPGA主頻比CPU慢,卻可以幫其加速?

文章出處:【微信公眾號(hào):FPGA技術(shù)江湖】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1663

    文章

    22491

    瀏覽量

    638810
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11320

    瀏覽量

    225781
  • 主頻
    +關(guān)注

    關(guān)注

    1

    文章

    22

    瀏覽量

    9345

原文標(biāo)題:為什么FPGA主頻比CPU慢,卻可以幫其加速?

文章出處:【微信號(hào):HXSLH1010101010,微信公眾號(hào):FPGA技術(shù)江湖】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Arm AGI CPU加速新一代基礎(chǔ)設(shè)施建設(shè)

    近期,Arm 推出 Arm AGI CPU,一款由 Arm 自主設(shè)計(jì)、面向人工智能 (AI) 數(shù)據(jù)中心的 CPU,旨在滿足日益增長的代理式 AI (Agentic AI) 工作負(fù)載需求。這標(biāo)志著 Arm 計(jì)算平臺(tái)進(jìn)入新的發(fā)展階段,首次將產(chǎn)品矩陣延伸至量產(chǎn)芯片產(chǎn)品領(lǐng)域。
    的頭像 發(fā)表于 04-09 15:55 ?248次閱讀

    基于openEuler平臺(tái)的CPU、GPU與FPGA異構(gòu)加速實(shí)戰(zhàn)

    隨著 AI、視頻處理、加密和高性能計(jì)算需求的增長,單一 CPU 已無法滿足低延遲、高吞吐量的計(jì)算需求。openEuler 作為面向企業(yè)和云端的開源操作系統(tǒng),在 多樣算力支持 方面表現(xiàn)出色,能夠高效調(diào)度 CPU、GPU、FPGA
    的頭像 發(fā)表于 04-08 11:02 ?477次閱讀
    基于openEuler平臺(tái)的<b class='flag-5'>CPU</b>、GPU與<b class='flag-5'>FPGA</b>異構(gòu)<b class='flag-5'>加速</b>實(shí)戰(zhàn)

    Linux服務(wù)器CPU飆高怎么排查

    線上 CPU 飆高最怕兩件事:一是盯著 top 看了半小時(shí),最后還是不知道是誰打滿了核;二是誤把負(fù)載高當(dāng)成 CPU 高,處理動(dòng)作反了,越處理越抖。生產(chǎn)環(huán)境里,CPU 問題通常不是單一
    的頭像 發(fā)表于 03-11 09:48 ?397次閱讀

    DIY電腦小白必看:CPU涂導(dǎo)熱硅脂教程與注意事項(xiàng)

    在組裝或升級(jí)電腦時(shí),很多人會(huì)把注意力放在CPU、散熱器、主板等核心硬件上,卻忽略了連接它們之間的一個(gè)關(guān)鍵環(huán)節(jié)——導(dǎo)熱硅脂。雖然它只是一層薄薄的“膏體”,但卻直接影響CPU的散熱效率和系統(tǒng)穩(wěn)定性。導(dǎo)熱
    的頭像 發(fā)表于 02-05 17:07 ?867次閱讀
    DIY電腦小白必看:<b class='flag-5'>CPU</b>涂導(dǎo)熱硅脂教程與注意事項(xiàng)

    MangoTree新品劇透:全新PXI形態(tài)+最強(qiáng)CPU #PXI #PXIe #測(cè)控 #CPU

    cpu
    芒果樹數(shù)字
    發(fā)布于 :2026年01月30日 11:36:11

    那么龍芯CPU性能如何呢?

    龍芯系列CPU的最新動(dòng)態(tài) 以下是龍芯系列CPU的最新動(dòng)態(tài)(截至2025年10月): 龍芯CPU的性能如何? 以下是龍芯CPU性能的詳細(xì)分析,結(jié)合最新產(chǎn)品與技術(shù)動(dòng)態(tài): 一、桌面處理器性能
    的頭像 發(fā)表于 12-03 13:42 ?1366次閱讀

    開源的e203rtl 可以FPGA板子(DDRt)跑50M主頻嗎?

    開源的e203rtl 可以FPGA板子(DDRt)跑50M主頻嗎? 跑25M時(shí),可以通過spi打印出來數(shù)數(shù)據(jù),但是跑50M主頻時(shí)候,看似下
    發(fā)表于 07-11 07:58

    單核CPU網(wǎng)關(guān)和雙核CPU網(wǎng)關(guān)有什么區(qū)別

    單核CPU網(wǎng)關(guān)與雙核CPU網(wǎng)關(guān)的核心區(qū)別在于處理能力、多任務(wù)效率、性能表現(xiàn)及適用場景,雙核CPU網(wǎng)關(guān)在多任務(wù)處理、復(fù)雜計(jì)算和響應(yīng)速度上具有顯著優(yōu)勢(shì),而單核CPU網(wǎng)關(guān)則更適合輕量級(jí)、低負(fù)
    的頭像 發(fā)表于 07-05 14:37 ?1229次閱讀

    主控CPU全能選手,英特爾至強(qiáng)6助力AI系統(tǒng)高效運(yùn)轉(zhuǎn)

    有什么特殊之處呢? AI加速系統(tǒng)為何看重CPU主控能力? 作為造價(jià)極高的AI加速系統(tǒng),DGX B300可以不計(jì)成本地選任何CPU,只要它能充
    的頭像 發(fā)表于 06-27 11:44 ?994次閱讀
    主控<b class='flag-5'>CPU</b>全能選手,英特爾至強(qiáng)6助力AI系統(tǒng)高效運(yùn)轉(zhuǎn)

    一片主板可以有多少路CPU?

    CPU是計(jì)算機(jī)的中央處理器,可以直接影響到服務(wù)器的并行處理能力。CPU路數(shù)越多,服務(wù)器可以同時(shí)處理的任務(wù)數(shù)量就越多,從而提高了整體的處理效率和性能,特別是在處理大量并發(fā)任務(wù)時(shí),多路服務(wù)
    的頭像 發(fā)表于 06-13 09:14 ?843次閱讀
    一片主板<b class='flag-5'>可以</b>有多少路<b class='flag-5'>CPU</b>?

    CPU Socket的基本結(jié)構(gòu)和工作原理

    CPU Socket是連接中央處理單元(CPU)與計(jì)算機(jī)主板之間的關(guān)鍵部件,它充當(dāng)著傳遞電信號(hào)、電源和散熱等多重功能的樞紐。在整個(gè)計(jì)算機(jī)系統(tǒng)中,CPU Socket的作用至關(guān)重要,尤其在高性能計(jì)算
    的頭像 發(fā)表于 05-08 17:14 ?2773次閱讀

    在KiCad的PCB編輯其中,有一個(gè)實(shí)用的工具,可以用來清理布線與過孔

    在KiCad的PCB編輯其中,有一個(gè)實(shí)用的工具,可以用來清理布線與過孔。不僅可以移除沒有使用的布線與過孔,還可以清理冗余的重疊導(dǎo)線。
    發(fā)表于 05-06 21:57

    國產(chǎn)電腦CPU性能排行榜TOP7:CPU緩存/主頻/多核實(shí)測(cè)數(shù)據(jù)分析

    在科技飛速發(fā)展的今天,電腦CPU(中央處理器)無疑是計(jì)算機(jī)性能的核心部件。而長久以來,國際品牌在這一領(lǐng)域占據(jù)著主導(dǎo)地位,給人一種國產(chǎn)CPU性能不行的刻板印象。然而,隨著技術(shù)的不斷進(jìn)步和研發(fā)投入的加大,國產(chǎn)電腦CPU性能已經(jīng)取得了
    的頭像 發(fā)表于 04-29 10:38 ?3826次閱讀
    國產(chǎn)電腦<b class='flag-5'>CPU</b>性能排行榜TOP7:<b class='flag-5'>CPU</b>緩存/<b class='flag-5'>主頻</b>/多核實(shí)測(cè)數(shù)據(jù)分析

    信創(chuàng)國產(chǎn)CPU推薦

    cpu
    jf_10805031
    發(fā)布于 :2025年04月23日 17:20:43

    CPU的各種指令和執(zhí)行流程

    在集成電路設(shè)計(jì)中,CPU的指令是指計(jì)算機(jī)中央處理單元(CPU用來執(zhí)行計(jì)算任務(wù)的基本操作指令集。這些指令是CPU能夠理解并執(zhí)行的二進(jìn)制代碼,它們?cè)谟?jì)算機(jī)內(nèi)部由硬件控制并按順序執(zhí)行,從而
    的頭像 發(fā)表于 04-18 11:24 ?2882次閱讀
    抚远县| 浏阳市| 永平县| 策勒县| 吴旗县| 夹江县| 大庆市| 盐池县| 怀化市| 鄂伦春自治旗| 福贡县| 来安县| 乌鲁木齐县| 晋宁县| 徐州市| 富民县| 新民市| 兴宁市| 保定市| 新宁县| 秦安县| 太仓市| 佛山市| 石泉县| 东光县| 广德县| 新宁县| 仁怀市| 青海省| 鹿泉市| 张家港市| 绵阳市| 英吉沙县| 东海县| 汤阴县| 晴隆县| 城固县| 湘西| 西城区| 通州市| 富锦市|