哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Ampere的192核云原生CPU首度導(dǎo)入Chiplet設(shè)計(jì)

安晟培半導(dǎo)體 ? 來源:問芯Voice ? 2023-06-21 18:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Ampere Computing以自有IP打造的192核云原生CPU——AmpereOne系列處理器的技術(shù)細(xì)節(jié)陸續(xù)曝光。其中一個(gè)大亮點(diǎn),是與上一代128核Ampere Altra對比,AmpereOne系列處理器中首度采用Chiplet設(shè)計(jì)。

半導(dǎo)體制程不斷演進(jìn)下,要實(shí)現(xiàn)復(fù)雜的芯片設(shè)計(jì)流程的門檻其實(shí)越來越高,芯片全流程設(shè)計(jì)的成本也大幅增加,這是摩爾定律放緩后出現(xiàn)的問題。因應(yīng)方式是Chiplet小芯片設(shè)計(jì)的興起,已經(jīng)開始被AMD、英特爾等處理器大芯片公司大舉采用。

Chiplet是一種模塊化芯片的技術(shù),將傳統(tǒng)片上系統(tǒng)(SoC)所需的微處理器模擬IP核、數(shù)字IP核和存儲(chǔ)器等模塊分開制造,并在后道工藝中集成為一個(gè)芯片模組,可實(shí)現(xiàn)不同模塊的混用、復(fù)用,且各模塊不需要在同一制程節(jié)點(diǎn)制造,因此另一個(gè)優(yōu)勢是能確保芯片的良率。

在AMD、英特爾陸續(xù)導(dǎo)入Chiplet設(shè)計(jì)后,Ampere Computing也在最新的AmpereOne系列處理器中實(shí)現(xiàn)Chiplet。

Ampere Computing首席產(chǎn)品官Jeff Wittich指出,Ampere開始大量采用小芯片的設(shè)計(jì)帶來了許多的優(yōu)勢,像是提升靈活度,以及加快了整個(gè)芯片設(shè)計(jì)周期。再者,采用Chiplet的設(shè)計(jì)也實(shí)現(xiàn)了特定的拓?fù)浣Y(jié)構(gòu),以及單一的計(jì)算裸片(里邊分布著全部的內(nèi)核),同時(shí)還有單一大網(wǎng)格結(jié)構(gòu),助力為客戶提供平衡的高性能。反之,其他設(shè)計(jì)則要求數(shù)據(jù)從一個(gè)計(jì)算的小芯片傳輸?shù)搅硪粋€(gè)小芯片,這種設(shè)計(jì)會(huì)帶來延遲問題。

Jeff Wittich強(qiáng)調(diào),在實(shí)現(xiàn)了最佳的Chiplet架構(gòu)之后,產(chǎn)品上市的速度就會(huì)更快,且可以提供芯片的可擴(kuò)展性。

wKgaomSSyzOAT1YAAAEccmyd_1s163.jpg
wKgZomSSy0KASm-5AACJDQarVYQ713.jpg

過去幾年間,Ampere Computing已經(jīng)陸續(xù)實(shí)現(xiàn)的128核的Ampere Altra系列處理器,在云環(huán)境的關(guān)鍵指標(biāo)——每機(jī)架性能方面超越其他競品像是英特爾和AMD等。這次全新的AmpereOne系列處理器是采用臺(tái)積電的5nm制程技術(shù),現(xiàn)在已投產(chǎn)并交付給客戶。

Jeff Wittich指出,AmpereOne能夠?yàn)樵乒ぷ髫?fù)載提供更高的性能、更高的可擴(kuò)展性以及更高的密度,也是第一款基于Ampere新自研核的產(chǎn)品,由Ampere自有IP全新打造,擁有多達(dá)192個(gè)單線程Ampere核。

192 核是一個(gè)非常大的數(shù)字,比英特爾和 AMD 的核心數(shù)還要多。 Ampere用一個(gè)具體的場景來說明,比如在云環(huán)境中運(yùn)行虛擬機(jī)(VM),用192核的AmpereOne對比96核的AMD Genoa,或者60核的英特爾Sapphire Rapids,AmpereOne每機(jī)架運(yùn)行的虛擬機(jī)數(shù)量是AMD Genoa的2.9倍,是英特爾Sapphire Rapids的4.3倍。

AmpereOne推出后,與之前推出的Ampere Altra、Ampere Altra Max未來發(fā)展的差異性如何?

Jeff Wittich指出,這兩個(gè)系列服務(wù)于不同的客戶需求。目前已經(jīng)在市場上持續(xù)交付的Ampere Altra系列,里面包含了幾款不同的產(chǎn)品,核數(shù)從32核到128核不等。而全新推出的AmpereOne系列并不是要取代Ampere Altra系列,而是在它的原本的基礎(chǔ)之上,進(jìn)行持續(xù)的擴(kuò)張。

在未來很長一段時(shí)間里,Ampere Altra 系列處理器還會(huì)繼續(xù)銷售,而最新的AmpereOne是在Ampere Altra Max 128核的基礎(chǔ)上,將核數(shù)進(jìn)一步提升到了最高可達(dá)192核。

客戶如何決定要采用AmpereOne?還是Ampere Altra?

他分析,完全是看場景應(yīng)用。在邊緣計(jì)算的場景下,可能只需要部署32核、功耗40瓦的Ampere Altra處理器就夠用了,但對于一些有更大算力需求的客戶,譬如大規(guī)模的數(shù)據(jù)中心,這時(shí)候更高的核數(shù)可以提供更好的性能,所以可能需要192核的AmpereOne系列處理器。

AI方面,Ampere也提供了幾個(gè)參考的基準(zhǔn),一是在生成式AI方面,相比AMD Genoa,AmpereOne可每秒多提供2.3倍的幀數(shù)(圖像),在運(yùn)行穩(wěn)定的擴(kuò)散模型中勝出。此外,在運(yùn)行DLRM模型的推薦系統(tǒng)中,通過AmpereOne響應(yīng)的查詢數(shù)量是AMD Genoa的每秒查詢數(shù)量的兩倍多。

此外,通過DDR5內(nèi)存技術(shù),以及128通道的PCIe 5.0的設(shè)計(jì),AmpereOne系列處理器不僅實(shí)現(xiàn)了性能的擴(kuò)展,也為云服務(wù)提供商和云工作負(fù)載提供價(jià)值。

由于新款的AmpereOne系列處理器是自研IP,是否會(huì)與上一代Ampere Altra系列有不相容的問題? Jeff Wittich表示,不會(huì)存在兼容性的問題,因?yàn)閮煽钐幚砥鞫际腔?a target="_blank">ARM ISA的。所有能夠在Ampere Altra系列處理器上運(yùn)行的代碼,在AmpereOne上運(yùn)行也沒有問題,不需要任何改動(dòng)。

針對進(jìn)行火爆的生成式AI對數(shù)據(jù)中心CPU市場的影響? Jeff Wittich表示,生成式AI進(jìn)一步加速了市場對算力的需求。

他分析,針對AI工作負(fù)載最常見的有兩大場景,第一是AI訓(xùn)練工作負(fù)載,即處理器在大量數(shù)據(jù)的基礎(chǔ)上建立模型,對于某些大模型來說,過程有時(shí)候不只需要幾個(gè)小時(shí)、幾天,甚至可能要花上數(shù)周甚至數(shù)月的時(shí)間。第二個(gè)場景就是AI推理,即在完成AI訓(xùn)練的基礎(chǔ)上,在應(yīng)用上去運(yùn)行模型。

雖然可能訓(xùn)練AI模型只需要一次,但是運(yùn)行模型還需要進(jìn)行上百萬次甚至數(shù)十億次,這些工作負(fù)載需要進(jìn)行非常快速的運(yùn)行,以盡可能快的速度向用戶交付數(shù)據(jù)和資源。

AI訓(xùn)練和AI推理的工作負(fù)載是非常不一樣的。 AI訓(xùn)練發(fā)生在服務(wù)器上的CPU、GPU,但是AI推理不一樣,它擴(kuò)展在整個(gè)云的部署中。這就意味著它對云的基礎(chǔ)建設(shè)提出了更高的要求。

所以AI訓(xùn)練和AI推理有三個(gè)主要不同,一個(gè)是就規(guī)模而言,AI推理需要更大的規(guī)模;第二,AI推理很有可能在通用服務(wù)器上和其他工作負(fù)載同時(shí)運(yùn)行;第三,AI推理對速度的要求更高,而且還需要不斷地進(jìn)行大量重復(fù),以向用戶快速交付結(jié)果。

Jeff Wittich表示,無論是Ampere Altra還是AmpereOne系列處理器都非常適用于AI推理,特別是大規(guī)模的云場景。目前,已經(jīng)有許多客戶都在使用Ampere Altra系列處理器進(jìn)行AI推理,并且得到我們Library中很多軟件工具的支持,包括TensorFlow、PyTorch、ONNX常用的主流框架。





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20325

    瀏覽量

    254705
  • 片上系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    205

    瀏覽量

    27725
  • 虛擬機(jī)
    +關(guān)注

    關(guān)注

    1

    文章

    973

    瀏覽量

    30687
  • chiplet
    +關(guān)注

    關(guān)注

    6

    文章

    499

    瀏覽量

    13643

原文標(biāo)題:媒體視角|Ampere的192核云原生CPU首度導(dǎo)入Chiplet設(shè)計(jì)

文章出處:【微信號:AmpereComputing,微信公眾號:安晟培半導(dǎo)體】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    瀚高數(shù)據(jù)庫深度參編國家標(biāo)準(zhǔn)《信息技術(shù) 云原生關(guān)系數(shù)據(jù)庫管理系統(tǒng)技術(shù)要求》正式發(fā)布

    濟(jì)南2026年4月15日 /美通社/ -- 近日,國家市場監(jiān)督管理總局、國家標(biāo)準(zhǔn)化管理委員會(huì)正式發(fā)布國家標(biāo)準(zhǔn) GB/T 47343-2026《信息技術(shù) 云原生關(guān)系數(shù)據(jù)庫管理系統(tǒng)技術(shù)要求》。作為我國
    的頭像 發(fā)表于 04-15 16:41 ?320次閱讀

    低功耗 10 位 ADC——MAX192 的深度剖析與應(yīng)用

    低功耗 10 位 ADC——MAX192 的深度剖析與應(yīng)用 在電子設(shè)計(jì)領(lǐng)域,模擬信號到數(shù)字信號的轉(zhuǎn)換是一項(xiàng)至關(guān)重要的技術(shù)。ADC(模擬 - 數(shù)字轉(zhuǎn)換器)作為實(shí)現(xiàn)這一轉(zhuǎn)換的關(guān)鍵器件,其性能直接影響
    的頭像 發(fā)表于 04-03 11:35 ?310次閱讀

    云原生全球廣域網(wǎng)架構(gòu)深度科普:從單點(diǎn)集中到全域互聯(lián)

    用與資源分散部署在不同地域的虛擬私有云、線下數(shù)據(jù)中心等多個(gè)節(jié)點(diǎn)時(shí),如何將這些分散的資源整合成一個(gè)邏輯統(tǒng)一的整體,成為企業(yè)數(shù)字化進(jìn)程中的核心命題。而云原生網(wǎng)絡(luò)架構(gòu),正
    的頭像 發(fā)表于 03-10 13:40 ?481次閱讀
    <b class='flag-5'>云原生</b>全球廣域網(wǎng)架構(gòu)深度科普:從單點(diǎn)集中到全域互聯(lián)

    LX2080釋放復(fù)位瞬間啟動(dòng)電流過大,有什么辦法讓CPU緩啟動(dòng)或者8個(gè)分時(shí)依次啟動(dòng)嗎?

    LX2080釋放復(fù)位瞬間啟動(dòng)電流過大,導(dǎo)致核電輸出被拉掉,有什么辦法讓CPU緩啟動(dòng)或者8個(gè)分時(shí)依次啟動(dòng)嗎?謝謝! 當(dāng)LX2080釋放復(fù)位信號時(shí),浪涌電流過高,導(dǎo)致核心功率輸出被拉低。有沒有辦法為
    發(fā)表于 03-03 07:14

    【乾芯QXS320F開發(fā)板試用】ipc間通信測試過程

    先對0的ipc_ex1_basic中ipc_core0編譯: 再對1的ipc_ex1_basic中ipc_core1編譯:導(dǎo)入后就可以編譯了 對0實(shí)時(shí)調(diào)試先調(diào)試
    發(fā)表于 12-10 16:10

    E203軟提高CPU時(shí)鐘頻率方法

    本文將分享我們團(tuán)隊(duì)提高E203軟主頻的辦法。 查閱芯來科技官方出版的《手把手教你設(shè)計(jì)CPU——RISC-V處理器篇》教材,我們發(fā)現(xiàn),原本設(shè)計(jì)的E203主時(shí)鐘域應(yīng)該是100MHZ
    發(fā)表于 10-29 06:19

    使用rk3568開發(fā)板,0\\1\\3運(yùn)行l(wèi)inux,2運(yùn)行hal,在0中怎么關(guān)閉2

    使用rk3568開發(fā)板,0\\\\1\\\\3運(yùn)行l(wèi)inux,2運(yùn)行hal,想在內(nèi)核中通過smc指令完成核0對2得啟動(dòng)和關(guān)閉,文件系統(tǒng)中/sys/rk_amp目錄下有個(gè)boot_cpu
    發(fā)表于 10-27 10:09

    解構(gòu)Chiplet,區(qū)分炒作與現(xiàn)實(shí)

    來源:內(nèi)容來自半導(dǎo)體行業(yè)觀察綜合。目前,半導(dǎo)體行業(yè)對芯片(chiplet)——一種旨在與其他芯片組合成單一封裝器件的裸硅片——的討論非常熱烈。各大公司開始規(guī)劃基于芯片的設(shè)計(jì),也稱為多芯片系統(tǒng)。然而
    的頭像 發(fā)表于 10-23 12:19 ?521次閱讀
    解構(gòu)<b class='flag-5'>Chiplet</b>,區(qū)分炒作與現(xiàn)實(shí)

    smp t113-s3 A7 多核cpu0 無法喚醒cpu1 怎么解決?

    過rt_hw_secondary_cpu_up 喚醒CPU1, CPU1的地址確認(rèn): The Soft Entry Address R
    發(fā)表于 10-14 07:14

    KiCad 已支持導(dǎo)入 Altium 工程(Project)

    “ ?9.0.3 的小版本更新中增加一個(gè)非常實(shí)用的功能:直接導(dǎo)入 Altium 的工程,省去了分別導(dǎo)入原理圖和 PCB 的麻煩。? ” ? Altium 導(dǎo)入器 從 ?8.0 開始,KiCad
    的頭像 發(fā)表于 07-21 11:15 ?3592次閱讀
    KiCad 已支持<b class='flag-5'>導(dǎo)入</b> Altium 工程(Project)

    單核CPU網(wǎng)關(guān)和雙CPU網(wǎng)關(guān)有什么區(qū)別

    單核CPU網(wǎng)關(guān)與雙CPU網(wǎng)關(guān)的核心區(qū)別在于處理能力、多任務(wù)效率、性能表現(xiàn)及適用場景,雙CPU網(wǎng)關(guān)在多任務(wù)處理、復(fù)雜計(jì)算和響應(yīng)速度上具有顯
    的頭像 發(fā)表于 07-05 14:37 ?1294次閱讀

    云原生環(huán)境里Nginx的故障排查思路

    本文聚焦于云原生環(huán)境下Nginx的故障排查思路。隨著云原生技術(shù)的廣泛應(yīng)用,Nginx作為常用的高性能Web服務(wù)器和反向代理服務(wù)器,在容器化和編排的環(huán)境中面臨著新的故障場景和挑戰(zhàn)。
    的頭像 發(fā)表于 06-17 13:53 ?1136次閱讀
    <b class='flag-5'>云原生</b>環(huán)境里Nginx的故障排查思路

    OPA192 高電壓、軌到軌輸入和輸出、5μV、精密運(yùn)算放大器技術(shù)手冊

    OPAx192 系列(OPA192、OPA2192 和 OPA4192)是新一代 36V e-trim 運(yùn)算放大器。
    的頭像 發(fā)表于 04-29 14:30 ?1613次閱讀
    OPA<b class='flag-5'>192</b> 高電壓、軌到軌輸入和輸出、5μV、精密運(yùn)算放大器技術(shù)手冊

    從 Java 到 Go:面向?qū)ο蟮木奕伺c云原生的輕騎兵

    (Goroutine/Channel) 在 云原生基礎(chǔ)設(shè)施領(lǐng)域 占據(jù)主導(dǎo)地位,它也是 Java 開發(fā)者探索云原生技術(shù)棧的關(guān)鍵補(bǔ)
    的頭像 發(fā)表于 04-25 11:13 ?736次閱讀

    Chiplet與先進(jìn)封裝設(shè)計(jì)中EDA工具面臨的挑戰(zhàn)

    Chiplet和先進(jìn)封裝通常是互為補(bǔ)充的。Chiplet技術(shù)使得復(fù)雜芯片可以通過多個(gè)相對較小的模塊來實(shí)現(xiàn),而先進(jìn)封裝則提供了一種高效的方式來將這些模塊集成到一個(gè)封裝中。
    的頭像 發(fā)表于 04-21 15:13 ?2199次閱讀
    <b class='flag-5'>Chiplet</b>與先進(jìn)封裝設(shè)計(jì)中EDA工具面臨的挑戰(zhàn)
    丽江市| 河津市| 常熟市| 中阳县| 高碑店市| 景宁| 玛沁县| 小金县| 罗源县| 安图县| 大理市| 三门峡市| 公主岭市| 蓝田县| 鹤峰县| 榆社县| 海口市| 尚义县| 阳朔县| 屯留县| 英德市| 宽城| 商丘市| 凤山市| 上饶市| 隆子县| 抚远县| 恩施市| 刚察县| 凤台县| 白朗县| 深州市| 淮南市| 衡东县| 酒泉市| 繁峙县| 云和县| 南漳县| 中江县| 柞水县| 英吉沙县|