哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何改進(jìn)CPU性能發(fā)展瓶頸問(wèn)題?

SSDFans ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-07-30 14:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

通常一個(gè)處理器包含多個(gè)核心(Core),集成 Cache 子系統(tǒng),內(nèi)存子系統(tǒng)通過(guò)內(nèi)部或外部總線與其通信。在經(jīng)典CPU中一般有兩個(gè)常用的組件:北橋(North Bridge)和南橋(South Bridge)。它們是處理器和內(nèi)存以及其他外設(shè)溝通的渠道。圖1給出了處理器、內(nèi)存、南北橋以及其他總線之間的關(guān)系。

圖1

從圖一可以看到:

1)處理器訪問(wèn)內(nèi)存需要通過(guò)北橋。

2)處理器訪問(wèn)所有的外設(shè)都需要通過(guò)北橋。

3)掛在南橋的所有設(shè)備訪問(wèn)內(nèi)存也需要通過(guò)北橋。

那么CPU訪問(wèn)南橋上的外部設(shè)備和北橋上的DDR內(nèi)存的訪問(wèn)速率受CPU的主頻、Local Bus帶寬、南橋外設(shè)總線的速率、CPU取指令機(jī)制等多方面所影響。

處理器主頻和集成度在過(guò)去二十年里一直按照摩爾定律在發(fā)展,從單核到多核以及超線程。處理器的性能提高不少,同時(shí)處理器的功耗也正比于主頻的三次方在增加。因?yàn)槭褂玫?a target="_blank">晶體管柵極材料存在漏電現(xiàn)象,高頻率下電子遷移顯著,勢(shì)必為導(dǎo)致產(chǎn)熱量增加,散熱帶了重大問(wèn)題。CPU歡快的朝著頻率越來(lái)越高的方向發(fā)展,受到物理極限的挑戰(zhàn),又轉(zhuǎn)為核數(shù)越來(lái)越多的方向發(fā)展。由于所有CPU Core都是通過(guò)共享一個(gè)北橋來(lái)讀取內(nèi)存,隨著核數(shù)如何的發(fā)展,北橋在響應(yīng)時(shí)間上的性能瓶頸越來(lái)越明顯當(dāng)北橋出現(xiàn)擁塞時(shí),所有的設(shè)備和處理器都要癱瘓。這種系統(tǒng)設(shè)計(jì)的另外一個(gè)瓶頸體現(xiàn)在對(duì)內(nèi)存的訪問(wèn)上。不管是處理器或者顯卡,還是南橋的硬盤(pán)、網(wǎng)卡或者光驅(qū),都需要頻繁訪問(wèn)內(nèi)存,當(dāng)這些設(shè)備都爭(zhēng)相訪問(wèn)內(nèi)存時(shí),增大了對(duì)北橋帶寬的競(jìng)爭(zhēng),而且北橋到內(nèi)存之間也只有一條總線。

為了改善對(duì)內(nèi)存的訪問(wèn)瓶頸,出現(xiàn)了另外一種系統(tǒng)設(shè)計(jì),內(nèi)存控制器并沒(méi)有被集成在北橋中,而是被單獨(dú)隔離出來(lái)以協(xié)調(diào)北橋與某個(gè)相應(yīng)的內(nèi)存之間的交互。系統(tǒng)結(jié)構(gòu)如圖2所示。

圖 2 所示的這種架構(gòu)增加了內(nèi)存的訪問(wèn)帶寬,緩解了不同設(shè)備對(duì)同一內(nèi)存訪問(wèn)的擁塞問(wèn)題,但是卻沒(méi)有改進(jìn)單一北橋芯片的瓶頸的問(wèn)題。

圖2

為了解決北橋北橋在響應(yīng)時(shí)間上的性能瓶頸,把內(nèi)存控制器(原本北橋中讀取內(nèi)存的部分)也做個(gè)拆分,平分到了每個(gè)CPU上。于是NUMA(Non-Uniform Memory Access)就出現(xiàn)了。內(nèi)存控制器集成到CPU內(nèi)部,Intel第二代酷睿I系列以及將主板北橋合并到CPU內(nèi)部,所以Intel第二代酷睿I系列沒(méi)有北橋,只有南橋。AMD沒(méi)有吞并北橋。順便補(bǔ)充一下Intel 單個(gè)socket只支持單個(gè)node,AMD 單個(gè)socket配對(duì)多個(gè)node。(Node,socket,core,thread)是NUMA中的概念,linux下查看cpu參數(shù)通過(guò)如下命令:

a)lscpu

圖3

圖3可以看出CPU是小端模式,每個(gè)CPU有一個(gè)core,每一個(gè)core有一個(gè)thread。三級(jí)cache大小,F(xiàn)lags查看支持的大頁(yè)內(nèi)存,比如pse 代表支持2MB的內(nèi)存頁(yè),pdpe1gb代表支持1G內(nèi)存頁(yè)。

b)cat /proc/cpuinfo

圖4

從圖4可以到Core ID、超線程數(shù)、Core的16進(jìn)制編碼(在DPDK應(yīng)用中會(huì)用到這些參數(shù))。

NUMA設(shè)計(jì)框架如圖5所示。紅色綠色箭頭代表訪問(wèn)處理器本地內(nèi)存(Local memory),紅色箭頭訪問(wèn)遠(yuǎn)程內(nèi)存(remote memory),即其他處理器的本地內(nèi)存,需要通過(guò)額外的總線!

NUMA中,雖然內(nèi)存直接attach在CPU上,但是由于內(nèi)存被平均分配在了各個(gè)die上。只有當(dāng)CPU訪問(wèn)自身直接attach內(nèi)存對(duì)應(yīng)的物理地址時(shí),才會(huì)有較短的響應(yīng)時(shí)間(后稱Local Access)。而如果需要訪問(wèn)其他CPU attach的內(nèi)存的數(shù)據(jù)時(shí),就需要通過(guò)inter-connect通道訪問(wèn),響應(yīng)時(shí)間就相比之前變慢了(后稱Remote Access)。所以NUMA(Non-Uniform Memory Access)就此得名。

圖5

從前面分析發(fā)現(xiàn),確實(shí)提高了CPU訪問(wèn)內(nèi)存和外設(shè)的速率,奈何CPU處理速率遠(yuǎn)遠(yuǎn)超過(guò)了內(nèi)存的吞吐速率,這里就帶來(lái)了CPU不必要的開(kāi)銷。一般來(lái)說(shuō),當(dāng)CPU從DDR中取指令時(shí),大概要花費(fèi)幾百個(gè)時(shí)鐘周期,在這幾百個(gè)時(shí)鐘周期內(nèi),處理器除了等待什么也不能做。在這種環(huán)境下,才提出了Cache的概念,其目的就是為了匹配處理器和內(nèi)存之間存在的巨大的速度鴻溝。

Cache 由三級(jí)組成,之所以對(duì)Cach 進(jìn)行分級(jí),也是從成本和生產(chǎn)工藝的角度考慮的。一級(jí)(L1)最快,但是容量最小,一級(jí)cache分為指令cache和數(shù)據(jù)cache,圖3中可以查看;三級(jí)(LLC, Last Level Cache)最慢,但是容量最大。當(dāng)CPU需要訪問(wèn)某個(gè)地址時(shí)候,首先在cache中目錄表中查詢是否有該內(nèi)容,有就直接取指令或者數(shù)據(jù),沒(méi)有就從DDR中取取指令或者數(shù)據(jù)。在cache有對(duì)應(yīng)的數(shù)據(jù)簡(jiǎn)稱指令命中,反之指令沒(méi)有命中。L3 cache命中,大約需要40個(gè)時(shí)鐘周期,L3 cache沒(méi)命中,一個(gè)內(nèi)存讀需要140個(gè)時(shí)鐘周期。

Cache 的預(yù)取指令分為時(shí)間局部性和空間局部性。時(shí)間局部性是指程序即將用到的指令/數(shù)據(jù)可能就是目前正在使用的指令數(shù)據(jù)。因此,當(dāng)前用到的指令/數(shù)據(jù)在使用完畢之后以暫時(shí)存放在Cache中,可以在將來(lái)的時(shí)候再被處理器用到??臻g局部性是指程序即將用到的指/數(shù)據(jù)可能與目前正在使用的指令/數(shù)據(jù)在空間上相鄰或者相近。因此,在處理器處理當(dāng)前指令/數(shù)據(jù)時(shí),可以從內(nèi)存中把相鄰區(qū)域的指令/數(shù)據(jù)讀取到Cache中,當(dāng)處理器需要處理相鄰內(nèi)存區(qū)域的指令/數(shù)據(jù)時(shí),可以直接從Cache中讀取,節(jié)省訪問(wèn)內(nèi)存的時(shí)間。這里可以創(chuàng)建一個(gè)二維數(shù)組,然后順序橫向a[i][j]和豎向a[j][i]賦值計(jì)算時(shí)間做對(duì)比,由于a[j][i]地址是跳躍性的賦值,cache不能命中,所以消耗的時(shí)間遠(yuǎn)遠(yuǎn)大于連續(xù)地址的賦值。

提高CPU性能還可以采用多核并行計(jì)算,一個(gè)時(shí)鐘周期讀取N條指令。在軟件上也可以做適當(dāng)?shù)南到y(tǒng)優(yōu)化和算法優(yōu)化,比如配置CPU 親和性,CPU 親和性(Core affinity)就是一個(gè)特定的任務(wù)要在某個(gè)定的 CPU 上盡量長(zhǎng)時(shí)間地運(yùn)行而不被遷移到其他處理器上的傾向性。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20327

    瀏覽量

    254751
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11326

    瀏覽量

    225841

原文標(biāo)題:CPU性能發(fā)展遇到的瓶頸

文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    處理器性能過(guò)剩?探秘CPU對(duì)SSD性能影響

    人們升級(jí)CPU的動(dòng)力逐漸下降,主要原因莫過(guò)于疲乏的性能增長(zhǎng),于是乎性能過(guò)剩不僅是廠商用以麻痹用戶的手段,而用戶也會(huì)因?yàn)闊o(wú)性能瓶頸慢慢的接受了
    發(fā)表于 04-21 18:00 ?2438次閱讀

    LED產(chǎn)業(yè)發(fā)展面臨六大瓶頸

    目前我國(guó)LED產(chǎn)業(yè)的發(fā)展正面臨六大瓶頸。一是政策與法律的瓶頸,各級(jí)***雖出臺(tái)了許多發(fā)展LED的法規(guī),但缺少整套規(guī)范的法規(guī);二是人才與管理的瓶頸
    發(fā)表于 12-13 12:16

    克服嵌入式CPU性能瓶頸

    我們已經(jīng)看到有兩個(gè)主要的技術(shù)性限制在不斷影響摩爾定律和和處理器性能的持續(xù)改進(jìn)。但技術(shù)在不斷發(fā)展。縮小特征尺寸有助于提高晶體管密度和頻率,而設(shè)計(jì)師也仍在設(shè)法縮小晶體管尺寸,單顆芯片上的晶體管數(shù)量有望超過(guò)
    發(fā)表于 08-26 15:50

    智能家居發(fā)展瓶頸是什么?如何才能突破瓶頸?

    智能家居發(fā)展瓶頸是什么?如何才能突破瓶頸?智能家居是一個(gè)讓人又愛(ài)又恨的行業(yè),智能家居在2013年就聲名遠(yuǎn)播,并且被家居企業(yè)、互聯(lián)網(wǎng)企業(yè)以及諸多相關(guān)企業(yè)看好。然而幾年時(shí)間過(guò)去了,智能家居的發(fā)展
    發(fā)表于 01-31 17:10

    我國(guó)物聯(lián)網(wǎng)的發(fā)展面臨什么瓶頸?

    物聯(lián)網(wǎng)產(chǎn)業(yè)鏈宏大,涵蓋了當(dāng)代信息技術(shù)的所有方面,并隨著行業(yè)應(yīng)用的發(fā)展還會(huì)創(chuàng)造出更多的技術(shù)和產(chǎn)品。我國(guó)物聯(lián)網(wǎng)發(fā)展正處于初級(jí)階段,加快發(fā)展仍需突破幾個(gè)瓶頸
    發(fā)表于 07-31 06:00

    物聯(lián)網(wǎng)發(fā)展有什么瓶頸?

    編者語(yǔ):目前“物聯(lián)網(wǎng)”正從一個(gè)概念逐步進(jìn)入“落地”階段,因此,必須突破我國(guó)物聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展瓶頸,推動(dòng)物聯(lián)網(wǎng)產(chǎn)業(yè)健康發(fā)展。全國(guó)政協(xié)委員徐曉蘭兩會(huì)提案物聯(lián)網(wǎng),徐曉蘭認(rèn)為,目前制約我國(guó)物聯(lián)網(wǎng)產(chǎn)業(yè)健康發(fā)
    發(fā)表于 09-30 07:30

    物聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展有什么瓶頸

    ,存在用戶隱私泄漏風(fēng)險(xiǎn)以及系統(tǒng)安全風(fēng)險(xiǎn),諸如此類安全問(wèn)題已成為物聯(lián)網(wǎng)技術(shù)發(fā)展過(guò)程中所面臨的重大威脅之一,也是物聯(lián)網(wǎng)的瓶頸。雖然近年來(lái)密碼學(xué)及分布式數(shù)據(jù)管理技術(shù)的發(fā)展提高了物聯(lián)網(wǎng)系統(tǒng)安全,但囿于物聯(lián)網(wǎng)
    發(fā)表于 08-27 23:14

    UWB定位的機(jī)遇與挑戰(zhàn) 室內(nèi)定位發(fā)展有哪些瓶頸?

    室內(nèi)定位發(fā)展有哪些瓶頸?1、定位精度與成本難以兩全近些年隨著UWB技術(shù)的發(fā)展越來(lái)越快,以及UWB室內(nèi)定位技術(shù)在生態(tài)鏈各環(huán)節(jié)的深入應(yīng)用與合作,其成本也在逐漸降低。室內(nèi)定位技術(shù)有很多,常見(jiàn)的包括RFID
    發(fā)表于 12-15 14:39

    怎么克服嵌入式CPU性能瓶頸?

    芯片功耗解析芯片的傳輸延時(shí)克服嵌入式CPU性能瓶頸
    發(fā)表于 03-09 07:11

    運(yùn)用TMAM客觀分析程序運(yùn)行過(guò)程中內(nèi)在CPU資源出現(xiàn)的瓶頸

    可能都會(huì)借助perf /bcc這些工具來(lái)尋找存在性能瓶頸的地方。性能出現(xiàn)瓶頸的原因很多比如 CPU、內(nèi)存、磁盤(pán)、架構(gòu)等?! ”疚木蛢H僅是針對(duì)
    發(fā)表于 11-10 16:52

    無(wú)線流媒體通信性能瓶頸的仿真研究

    本文仿真研究Ad-hoc無(wú)線網(wǎng)絡(luò)環(huán)境下MPEG-4流媒體的通信性能,在分析和探討無(wú)線實(shí)時(shí)流媒體網(wǎng)絡(luò)性能瓶頸以及各類圖像幀的影響權(quán)值的基礎(chǔ)上,提出一種性能
    發(fā)表于 07-08 08:43 ?14次下載

    芯片開(kāi)發(fā)商ARM宣布對(duì)CPU與GPU的一系列改進(jìn)性能大幅提升

    芯片開(kāi)發(fā)商ARM宣布對(duì)CPU與GPU的一系列改進(jìn),當(dāng)芯片在Windows筆記本上運(yùn)行時(shí),性能大幅提升。
    的頭像 發(fā)表于 06-04 14:54 ?4540次閱讀

    突破性能瓶頸,實(shí)現(xiàn)CPU與內(nèi)存高性能互連

    日新月異,推動(dòng)CPU算力爆炸式增長(zhǎng)。高性能計(jì)算單元核數(shù)不斷增加,對(duì)內(nèi)存的容量和帶寬需求也在持續(xù)上升。然而,內(nèi)存技術(shù)的發(fā)展滯后于CPU,系統(tǒng)整體計(jì)算
    發(fā)表于 12-01 15:13 ?1130次閱讀

    CPU單核性能與多核性能的區(qū)別

    CPU的單核性能與多核性能在多個(gè)方面存在顯著的差異,這些差異主要體現(xiàn)在處理能力、應(yīng)用場(chǎng)景、性能瓶頸以及技術(shù)
    的頭像 發(fā)表于 09-02 14:42 ?2.2w次閱讀

    華為云 X 實(shí)例 CPU 性能測(cè)試詳解與優(yōu)化策略

    分析 ? 3.2 CPU性能瓶頸分析 ? 4. CPU性能優(yōu)化策略 ? 4.1 優(yōu)化CPU
    的頭像 發(fā)表于 12-30 14:52 ?1686次閱讀
    華為云 X 實(shí)例 <b class='flag-5'>CPU</b> <b class='flag-5'>性能</b>測(cè)試詳解與優(yōu)化策略
    华宁县| 上饶市| 梁河县| 阿巴嘎旗| 宜阳县| 上饶市| 鄂托克前旗| 紫云| 泾阳县| 揭西县| 胶州市| 黑山县| 新竹县| 资源县| 新建县| 翼城县| 宣汉县| 云和县| 西乡县| 南城县| 乌恰县| 德州市| 宜兰市| 宜黄县| 中宁县| 安福县| 油尖旺区| 微山县| 宜兰市| 闽侯县| 墨脱县| 珲春市| 堆龙德庆县| 慈溪市| 澄江县| 太原市| 襄城县| 甘肃省| 绥化市| 邵阳县| 得荣县|