哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RapidStream:FPGA HLS設(shè)計(jì)的并行物理實(shí)現(xiàn)

SSDFans ? 來(lái)源:SSDFans ? 作者: EVE ? 2022-05-25 09:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

FPGA的布局布線軟件向來(lái)跑得很慢。事實(shí)上,F(xiàn)PGA供應(yīng)商已經(jīng)花了很大的精力使其設(shè)計(jì)軟件在多核處理器上運(yùn)行得更快。

最近,在ACM的FPGA 2022會(huì)議上發(fā)表了一篇題為“RapidStream: FPGA HLS設(shè)計(jì)的并行物理實(shí)現(xiàn)”的論文,論文中描述了一種非常有趣的方法,通過(guò)FPGA設(shè)計(jì)軟件推動(dòng)HLS設(shè)計(jì)更快地運(yùn)行在多核處理器上。

這篇論文由UCLA、AMD-Xilinx、根特大學(xué)和康奈爾大學(xué)的研究團(tuán)隊(duì)撰寫(xiě),描述了RapidStream自動(dòng)分區(qū)算法,將數(shù)據(jù)流設(shè)計(jì)分割成多個(gè)“island”,在劃分的island之間插入“anchor regions”,然后通過(guò)anchor regions中的寄存器將每個(gè)island的信號(hào)連起來(lái)整合到整個(gè)設(shè)計(jì)中。

所有這些劃分和拼接背后的目的是將HLS設(shè)計(jì)分割成小塊,交付給現(xiàn)代服務(wù)器中的多個(gè)核心。這種策略已經(jīng)有悠久的歷史,現(xiàn)在被用于加速FPGA的開(kāi)發(fā)。

這個(gè)過(guò)程有三個(gè)主要的HLS級(jí)約束:

1、非重疊分區(qū)——并行化不同island的物理實(shí)現(xiàn);

2、流水線化的island間連接——每個(gè)island間連接都流水線化,以滿足時(shí)序要求;

3、直接連接——每個(gè)island只能與相鄰的island直接連接。當(dāng)并行化設(shè)計(jì)布局布線時(shí),這個(gè)約束是至關(guān)重要的。

(注意:這些約束與用于控制邏輯綜合的各種約束完全不同,它處于一個(gè)更高的層次。)

RapidStream的開(kāi)發(fā)者將數(shù)據(jù)流設(shè)計(jì)定義為一組并行處理元素(processing element,簡(jiǎn)稱(chēng)PE)和一組根據(jù)設(shè)計(jì)的數(shù)據(jù)流需求將PE連接起來(lái)的FIFO。PE內(nèi)部可以很復(fù)雜,但只能通過(guò)FIFO接口與其他PE進(jìn)行數(shù)據(jù)通信。

如上所述,RapidStream將FPGA fabric劃分為兩種region:大小相同的region和在相鄰region之間以窄列和行放置的anchor region。有趣的是,RapidStream似乎是專(zhuān)門(mén)為AMD-Xilinx Virtex UltraScale+ FPGA構(gòu)建的,這是由FPGAchiplet(AMD-Xilinx語(yǔ)言中的超級(jí)邏輯區(qū)域,簡(jiǎn)稱(chēng)SLR)制成的2.5D器件。

a247143c-dbbf-11ec-ba43-dac502259ad0.png

這篇論文包含了幾個(gè)描述RapidStream工作性能的圖表。下圖顯示了在分區(qū)后,六種不同的數(shù)據(jù)流設(shè)計(jì)與沒(méi)有分區(qū)的流水線/非流水線版本時(shí)鐘速率的比較。

a2b9d65c-dbbf-11ec-ba43-dac502259ad0.png

從上圖可以看出,RapidStream比所有非流水線版本的時(shí)鐘速率更高。這是意料之中的,因?yàn)榱魉€是FPGA時(shí)鐘速度改進(jìn)的核心。然而,六種情況中,有五種情況RapidStream的結(jié)果比相同設(shè)計(jì)的流水線RTL版本要好,這個(gè)結(jié)果要引起我們的注意。

下面是布局布線的時(shí)間結(jié)果對(duì)比:

a33394ce-dbbf-11ec-ba43-dac502259ad0.png

RapidStream的布局布線運(yùn)行時(shí)間比未分區(qū)設(shè)計(jì)的結(jié)果要好得多。這是因?yàn)镽apidStream可以將每個(gè)分區(qū)送給不同的處理器核心來(lái)布局布線。

雖然FPGA供應(yīng)商試圖讓布局布線算法在多核處理器上工作得更快,但RapidStream的開(kāi)發(fā)人員根據(jù)經(jīng)驗(yàn)發(fā)現(xiàn),如果FPGA設(shè)計(jì)沒(méi)有分區(qū),在超過(guò)兩個(gè)處理器核心上運(yùn)行AMD-Xilinx Vivado設(shè)計(jì)工具時(shí)并沒(méi)有太大改善。

如果有讀者正在用FPGA開(kāi)發(fā)HLS設(shè)計(jì)——特別是AMD-Xilinx FPGA,那么應(yīng)該會(huì)對(duì)RapidStream感興趣。更細(xì)節(jié)的內(nèi)容可以在GitHub上找到。

原文標(biāo)題:HLS分區(qū)加速FPGA布局布線!

文章出處:【微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1663

    文章

    22487

    瀏覽量

    638686
  • Xilinx
    +關(guān)注

    關(guān)注

    73

    文章

    2205

    瀏覽量

    131775
  • 布局布線
    +關(guān)注

    關(guān)注

    1

    文章

    90

    瀏覽量

    15537
  • HLS
    HLS
    +關(guān)注

    關(guān)注

    1

    文章

    135

    瀏覽量

    25957

原文標(biāo)題:HLS分區(qū)加速FPGA布局布線!

文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于FPGA的DAQ系統(tǒng)|實(shí)現(xiàn)高性能數(shù)據(jù)采集的挑戰(zhàn)

    的性能和靈活性備受關(guān)注。FPGA,就像一塊可以根據(jù)我們需求“變形”的芯片,可高速并行處理大量數(shù)據(jù),實(shí)現(xiàn)傳統(tǒng)處理器難以達(dá)到的低延遲和高性能,使其在需要高吞吐量和精確
    的頭像 發(fā)表于 03-30 15:38 ?335次閱讀
    基于<b class='flag-5'>FPGA</b>的DAQ系統(tǒng)|<b class='flag-5'>實(shí)現(xiàn)</b>高性能數(shù)據(jù)采集的挑戰(zhàn)

    倒計(jì)時(shí)開(kāi)始!Embedded World 2026,Enclustra邀你見(jiàn)證FPGA/SoC與物理AI的未來(lái)

    你是否想過(guò),一座城市如何實(shí)時(shí)“看見(jiàn)”每個(gè)街角的人流、車(chē)流,甚至自動(dòng)識(shí)別突發(fā)狀況?當(dāng)AI從云端下沉到邊緣,FPGA物理AI的結(jié)合正在讓這一切成為現(xiàn)實(shí)。2026年3月10日-12日,全球嵌入式頂級(jí)盛會(huì)
    的頭像 發(fā)表于 03-05 07:33 ?337次閱讀
    倒計(jì)時(shí)開(kāi)始!Embedded World 2026,Enclustra邀你見(jiàn)證<b class='flag-5'>FPGA</b>/SoC與<b class='flag-5'>物理</b>AI的未來(lái)

    超級(jí)電容恒流放電怎么實(shí)現(xiàn)

    FPGA通過(guò)多通道并行、納秒級(jí)采樣與PI閉環(huán),實(shí)現(xiàn)超級(jí)電容恒流放電與均壓,提升效率與壽命。
    的頭像 發(fā)表于 02-12 09:28 ?408次閱讀
    超級(jí)電容恒流放電怎么<b class='flag-5'>實(shí)現(xiàn)</b>

    HLS設(shè)計(jì)中的BRAM使用優(yōu)勢(shì)

    高層次綜合(HLS)是一種將高級(jí)編程語(yǔ)言(如C、C++或SystemC)轉(zhuǎn)換為硬件描述語(yǔ)言(HDL)的設(shè)計(jì)方法。在FPGA設(shè)計(jì)中,設(shè)計(jì)者可以靈活地利用FPGA內(nèi)部的資源,如塊RAM(BRAM)。雖然
    的頭像 發(fā)表于 01-28 14:36 ?385次閱讀

    通過(guò)vivado HLS設(shè)計(jì)一個(gè)FIR低通濾波器

    Vivado HLS是一款強(qiáng)大的高層次綜合工具,可將C/C++代碼轉(zhuǎn)換為硬件描述語(yǔ)言(HDL),顯著提升FPGA開(kāi)發(fā)效率。
    的頭像 發(fā)表于 01-20 16:19 ?498次閱讀
    通過(guò)vivado <b class='flag-5'>HLS</b>設(shè)計(jì)一個(gè)FIR低通濾波器

    RapidIO標(biāo)準(zhǔn)的串行物理實(shí)現(xiàn)

    Serial RapidIO(SRIO) 特指 RapidIO 標(biāo)準(zhǔn)的串行物理實(shí)現(xiàn)。
    的頭像 發(fā)表于 12-09 10:41 ?667次閱讀
    RapidIO標(biāo)準(zhǔn)的串行<b class='flag-5'>物理</b>層<b class='flag-5'>實(shí)現(xiàn)</b>

    嵌入式和FPGA的區(qū)別

    嵌入式系統(tǒng)與FPGA的核心差異:軟件定義功能VS硬件可重構(gòu)。嵌入式適合通用計(jì)算,開(kāi)發(fā)門(mén)檻低;FPGA憑借并行處理實(shí)現(xiàn)納秒級(jí)響應(yīng),但成本高、開(kāi)發(fā)難。二者融合的SoC器件正成為未來(lái)趨勢(shì),平
    發(fā)表于 11-19 06:55

    如何利用Verilog HDL在FPGA實(shí)現(xiàn)SRAM的讀寫(xiě)測(cè)試

    本篇將詳細(xì)介紹如何利用Verilog HDL在FPGA實(shí)現(xiàn)SRAM的讀寫(xiě)測(cè)試。SRAM是一種非易失性存儲(chǔ)器,具有高速讀取和寫(xiě)入的特點(diǎn)。在FPGA實(shí)現(xiàn)SRAM讀寫(xiě)測(cè)試,包括設(shè)計(jì)SRA
    的頭像 發(fā)表于 10-22 17:21 ?4527次閱讀
    如何利用Verilog HDL在<b class='flag-5'>FPGA</b>上<b class='flag-5'>實(shí)現(xiàn)</b>SRAM的讀寫(xiě)測(cè)試

    基于FPGA的壓縮算法加速實(shí)現(xiàn)

    本設(shè)計(jì)中,計(jì)劃實(shí)現(xiàn)對(duì)文件的壓縮及解壓,同時(shí)優(yōu)化壓縮中所涉及的信號(hào)處理和計(jì)算密集型功能,實(shí)現(xiàn)對(duì)其的加速處理。本設(shè)計(jì)的最終目標(biāo)是證明在充分并行化的硬件體系結(jié)構(gòu) FPGA
    的頭像 發(fā)表于 07-10 11:09 ?2557次閱讀
    基于<b class='flag-5'>FPGA</b>的壓縮算法加速<b class='flag-5'>實(shí)現(xiàn)</b>

    如何在Unified IDE中創(chuàng)建視覺(jué)庫(kù)HLS組件

    最近我們分享了開(kāi)發(fā)者分享|AMD Vitis HLS 系列 1 - AMD Vivado IP 流程(Vitis 傳統(tǒng) IDE)和開(kāi)發(fā)者分享|AMD Vitis HLS 系列 2:AMD
    的頭像 發(fā)表于 07-02 10:55 ?1644次閱讀
    如何在Unified IDE中創(chuàng)建視覺(jué)庫(kù)<b class='flag-5'>HLS</b>組件

    使用AMD Vitis Unified IDE創(chuàng)建HLS組件

    這篇文章在開(kāi)發(fā)者分享|AMD Vitis HLS 系列 1 - AMD Vivado IP 流程(Vitis 傳統(tǒng) IDE) 的基礎(chǔ)上撰寫(xiě),但使用的是 AMD Vitis Unified IDE,而不是之前傳統(tǒng)版本的 Vitis HLS。
    的頭像 發(fā)表于 06-20 10:06 ?2504次閱讀
    使用AMD Vitis Unified IDE創(chuàng)建<b class='flag-5'>HLS</b>組件

    如何使用AMD Vitis HLS創(chuàng)建HLS IP

    本文逐步演示了如何使用 AMD Vitis HLS 來(lái)創(chuàng)建一個(gè) HLS IP,通過(guò) AXI4 接口從存儲(chǔ)器讀取數(shù)據(jù)、執(zhí)行簡(jiǎn)單的數(shù)學(xué)運(yùn)算,然后將數(shù)據(jù)寫(xiě)回存儲(chǔ)器。接著會(huì)在 AMD Vivado Design Suite 設(shè)計(jì)中使用此 HLS
    的頭像 發(fā)表于 06-13 09:50 ?2203次閱讀
    如何使用AMD Vitis <b class='flag-5'>HLS</b>創(chuàng)建<b class='flag-5'>HLS</b> IP

    并行CRC實(shí)現(xiàn)

    電子發(fā)燒友網(wǎng)站提供《并行CRC實(shí)現(xiàn).pdf》資料免費(fèi)下載
    發(fā)表于 05-20 17:26 ?0次下載

    Vivado HLS設(shè)計(jì)流程

    為了盡快把新產(chǎn)品推向市場(chǎng),數(shù)字系統(tǒng)的設(shè)計(jì)者需要考慮如何加速設(shè)計(jì)開(kāi)發(fā)的周期。設(shè)計(jì)加速主要可以從“設(shè)計(jì)的重用”和“抽象層級(jí)的提升”這兩個(gè)方面來(lái)考慮。Xilinx 推出的 Vivado HLS 工具可以
    的頭像 發(fā)表于 04-16 10:43 ?1764次閱讀
    Vivado <b class='flag-5'>HLS</b>設(shè)計(jì)流程

    FPGA并行通信讀取位置角度AD2S1210的最快角度更新速率是多少,是1/t16 HZ嗎?

    ADI工程師你好,請(qǐng)問(wèn)用FPGA并行通信讀取位置角度 AD2S1210的最快角度更新速率是多少,是1/t16 HZ嗎
    發(fā)表于 04-16 06:38
    日照市| 千阳县| 玛曲县| 扶余县| 东山县| 福建省| 辽宁省| 出国| 仲巴县| 安仁县| 衢州市| 读书| 靖西县| 芜湖县| 镇沅| 上林县| 诸暨市| 温泉县| 饶平县| 鄂托克旗| 靖宇县| 玉树县| 龙口市| 日土县| 漳州市| 柞水县| 凤城市| 潜江市| 留坝县| 临安市| 六枝特区| 福建省| 南江县| 乳源| 怀远县| 上蔡县| 礼泉县| 武强县| 达拉特旗| 巴东县| 邻水|