哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD祭出殺手锏,首個百億億級GPU

E4Life ? 來源:電子發(fā)燒友原創(chuàng) ? 作者:Leland ? 2021-11-11 09:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AMD祭出殺手锏,首個百億億級GPU

在不久前結(jié)束的 “加速數(shù)據(jù)中心”發(fā)布會上,AMD正式公開了下一代服務器CPU Milan-X和GPU加速卡Instinct MI200。這兩大產(chǎn)品系列不僅面向數(shù)據(jù)中心,也將面向一系列HPC和超算應用,把通用計算和AI性能推向極致。Instinct MI200作為GPU加速卡,更是成為超級計算機百億億級(Exascale)的算力的基本構(gòu)成單元。

在市場合作上,AMD更是開始了新一輪的攻城略地,前不久剛和騰訊聯(lián)合發(fā)布了星星海服務器產(chǎn)品后,如今Azure等一眾公有云廠商也開始部署基于Milan-X的服務器,甚至將剛改名為Meta的Facebook也被拉攏至AMD陣營,宣布將在其數(shù)據(jù)中心部署AMD的服務器產(chǎn)品。

Milan-X:6nm的大緩存怪獸

繼上一代Milan處理器推出后不到一年,AMD就發(fā)布了該芯片的6nm改進版Milan-X。今年上半年通過融合Chiplet和Die堆疊兩大技術(shù),在Ryzen桌面處理器上做了3D Chiplet架構(gòu)的演示。如今第三代Epyc處理器Milan-X,將成為首個使用該技術(shù)的服務器產(chǎn)品。通過在Chiplet上堆疊緩存,Milan-X的L3緩存是Milan的三倍,達到了可怕的768MB。

MilanX / AMD

英特爾一樣,AMD在正式發(fā)售前并沒有公布Milan-X的具體性能細節(jié),而是通過合作伙伴的測試來展示了Milan-X在EDA和公有云應用中表現(xiàn)。在新思的VCS功能驗證中,Milan-X在1小時內(nèi)完成了40.6項任務,而同樣核心數(shù)的Milan僅完成了24.4項。微軟在基于Milan-X的Azure服務器中進行了早期測試,無論是在航天模擬,還是在汽車碰撞測試建模中,Milan-X都做到了50%以上的性能提升。

除此之外,AMD CEO蘇資豐博士還透露了下一代5nm Epyc處理器Genoa的情報?;赯en 4架構(gòu)的Genoa將具備2倍的晶體管密度和2倍的能效,性能可以達到上一代的1.25倍以上。Genoa最高支持96個Zen 4核心,同時也將加入一系列新標準的支持,比如DDR5、PCIe 5.0和CXL。AMD還將推出基于5nm的Zen 4C核心的處理器Bergamo,專門針對要求多核多線程的云原生計算,最高核心數(shù)將達到128核,晚于Genoa發(fā)布。

Genoa計劃在2022年量產(chǎn)和發(fā)布,屆時很可能就是英特爾的Sapphire Rapids和AMD的Genoa在通用計算領(lǐng)域爭雄了。

Instinct MI200:GPU終于迎來MCM時代了?

除了Milan-X之外,發(fā)布會的最大亮點其實是全球首個MCM GPU,Instinct MI200。同樣基于臺積電的6nm工藝,Instinct MI200系列單芯片的晶體管數(shù)目達到580億,最高集成了220個計算單元。作為首個采用AMD CDNA2架構(gòu)的服務器GPU,Instinct MI200的目標很明確,那就是將計算能力推向ExaScale級。


在CDN2架構(gòu)和第二代HPC&AI專用矩陣核心的支持下,Instinct MI200實現(xiàn)了遠超競品的性能表現(xiàn)。數(shù)據(jù)對比環(huán)節(jié),AMD選擇拿Nvidia目前最強的A100加速卡開刀。MI250X的FP64向量計算能力達到47.9TF,F(xiàn)P64矩陣計算能力達到95.7TF,均為A100的4.9倍。而在AI領(lǐng)域常用的FP16和BF16矩陣計算中,MI250X的算力也達到了383TF,是A100的1.2倍。即便兩者都用上了HBM2E,MI200的內(nèi)存帶寬也達到了3.2TB/s,遠超A100的2TB/s。不過MI250X的功耗確實要高出不少,峰值狀態(tài)下的功耗可以達到560W,而A100的峰值功耗為300W。


與英特爾這種IDM廠商不同,AMD在封裝上基本吃透了與臺積電合作帶來的技術(shù)紅利,尤其是臺積電的3D Fabric封裝技術(shù)集合,而Instinct MI200則是這些技術(shù)的集大成之作。作為首個采用多Die設計的GPU,Instinct MI200選用了兩個SoC+8個HBM2E的方案,AMD在發(fā)布會上宣稱這一設計的實現(xiàn)要歸功于2.5D的Elevated Fanout Bridge(EFB)架構(gòu)。

從圖解上來看,AMD的EFB與臺積電的InFO-L 2.5D封裝技術(shù)可以說是從一個模子里刻出來的。在專門用于HBM集成的方案,目前可以做到這種規(guī)模的異構(gòu)似乎也只有臺積電的InFO-L和CoWoS-L,利用LSI(本地硅互聯(lián))芯片,為SoC到SoC與SoC到HBM提供高布線密度的互聯(lián)。

其實英特爾也有類似的2.5D封裝方案EMIB,只不過該方案是在基板內(nèi)放入一個硅橋die。而反觀AMD的EFB和臺積電的LSI方案則是將其至于基板的模具中,模具內(nèi)分布著一系列銅柱。相較之下,EMIB雖然可以做到更低的寄生電感,卻也對于基板的加工提出了很高的要求,這也是為何只有英特爾這個基板大廠才使用EMIB的原因之一。不過隨著IDM 2..0模式的展開,英特爾也將公開提供自己的制程、IP和封裝技術(shù),未來也許會有其他廠商的芯片開始用上EMIB。但目前來看,雖然增加了高度控制的挑戰(zhàn),但為了使用標準的基板降低成本,EFB和LSI明顯是最優(yōu)解。

在外觀尺寸上,AMD選擇了OAM和PCIe兩種形式。OAM為開放計算項目(OCP)定下的通用加速器模組標準,對于想要規(guī)模化部署GPU或其他加速器來說,OAM可以提供更大的帶寬。作為Facebook和微軟共同推行的公開標準,OAM已經(jīng)在服務器領(lǐng)域有了不小的規(guī)模,不僅是英特爾、AMD和英偉達這些半導體廠商,浪潮、聯(lián)想、百度和阿里巴巴等其他服務器與公有云廠商也開始支持這一標準。

目前OAM的MI250和MI250X已經(jīng)進入可交付階段,從今年第三季度起,AMD就已經(jīng)在為美國能源部的橡樹嶺國家實驗室持續(xù)交付MI250X GPU了,用于組成美國首個ExaScale級別的超級計算機Frontier。除了OAM模組外,AMD也將在不久提供PCIe版本的MI210,用于非密集運算的場景。

結(jié)語

隨著英特爾、三星和臺積電在2.5D/3D封裝技術(shù)上的逐漸成熟,服務器芯片將成為受益最大的產(chǎn)品,未來2+8甚至3+8的MCM GPU可能更加常見。英偉達、AMD與英特爾三家在服務器/數(shù)據(jù)中心市場上的動向,也側(cè)面體現(xiàn)了IDM與Fabless廠商之間在技術(shù)選擇上的差異。英特爾如果不能盡快在制程和封裝上超越臺積電這樣的晶圓代工廠,在服務器市場的優(yōu)勢可能會越來越小。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5703

    瀏覽量

    140371
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11320

    瀏覽量

    225801
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5258

    瀏覽量

    136037
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AMD獲Meta千億美元芯片大單,AI芯片市場格局生變

    GPUAMD Helios整機柜服務器,預計于今年晚些時候開啟交付。 AMD首席執(zhí)行官蘇姿豐稱,交易價值每吉瓦達百億美元級別,協(xié)議總金額或超600
    的頭像 發(fā)表于 02-26 09:19 ?5943次閱讀
    <b class='flag-5'>AMD</b>獲Meta千億美元芯片大單,AI芯片市場格局生變

    國產(chǎn)GPU再下一城,群起突圍英偉達+AMD

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)去年底以來國產(chǎn)GPU廠商陸續(xù)開啟上市輔導,最近摩爾線程、沐曦IPO獲受理。另消息稱,壁仞科技已完成新一輪約15元融資,并計劃最快今年8月向港交所申請IPO,籌備赴港
    的頭像 發(fā)表于 07-07 08:59 ?7505次閱讀
    國產(chǎn)<b class='flag-5'>GPU</b>再下一城,群起突圍英偉達+<b class='flag-5'>AMD</b>

    OpenClaw引爆AI存力!長江存儲eSSD三箭齊發(fā),有何殺手锏

    SIA數(shù)據(jù)顯示,從2024年到2029年,eSSD需求的復合增長率達到34.9%。長江存儲固態(tài)硬盤事業(yè)部負責人譚弘就AI時代的存力瓶頸和長江存儲企業(yè)解決方案進行精彩的演講。
    的頭像 發(fā)表于 03-31 09:36 ?1.4w次閱讀
    OpenClaw引爆AI存力!長江存儲eSSD三箭齊發(fā),有何<b class='flag-5'>殺手锏</b>?

    24小時訂單破6萬!26.98萬起,華為王炸配置押注智慧SUV問界M6

    3月23日,在華為春季全場景新品發(fā)布會上,華為終端 BG 首席執(zhí)行官何剛宣布,搭載896線激光雷達的問界M6正式上市,問界M6最大的殺手锏在于其“全系標配激光雷達 + 華為ADS 4.0高階智駕”的策略,發(fā)布會24小時訂單破6萬。
    的頭像 發(fā)表于 03-26 11:22 ?9476次閱讀
    24小時訂單破6萬!26.98萬起,華為王炸配置押注智慧SUV問界M6

    如何在 VisionFive v2 上使用外部 GPU

    如果舊的 amd gpu 在 VisionFive V2 上運行,我想使用帶有開源 amd 驅(qū)動程序的 amd gpu。我需要什么以及如何將
    發(fā)表于 03-13 06:38

    當歐洲押注百億億次超算,工程師為什么重新審視“晶振”?

    歐洲即將交付的新一代超級計算機 Alice Recoque,由 Eviden、SiPearl 和 AMD 聯(lián)手打造??偼顿Y 5.54 歐元,由法國、荷蘭和希臘共同資助,預計2026年啟用。將應用于氣候模擬、醫(yī)學研究、人工智能與量子計
    的頭像 發(fā)表于 03-06 16:51 ?2553次閱讀
    當歐洲押注<b class='flag-5'>百億億</b>次超算,工程師為什么重新審視“晶振”?

    中科曙光液體相變冷卻散熱技術(shù)實現(xiàn)算力與節(jié)能雙向突破

    一秒鐘,于人而言不過是一次眨眼的瞬間;于大規(guī)模智能計算而言,超級計算機已完成百億億次運算。但算力躍升的背后,日益攀升的耗電量,成為中科曙光工業(yè)設計與項目研發(fā)團隊面前的一道硬坎。
    的頭像 發(fā)表于 02-06 09:27 ?664次閱讀

    解析ISL62776:AMD CPU/GPU核心電源的理想之選

    解析ISL62776:AMD CPU/GPU核心電源的理想之選 在如今的電子設備中,CPU和GPU的性能不斷提升,對電源管理的要求也越來越高。ISL62776作為一款專為AMD CPU
    的頭像 發(fā)表于 02-04 16:30 ?373次閱讀

    強勢進入企業(yè)SATA SSD賽道!江波龍有哪些殺手锏,加入中移動產(chǎn)業(yè)鏈

    10月10日到12日,中國移動全球合作伙伴大會上,國產(chǎn)存儲廠商頭部企業(yè)江波龍以“存算合一,合創(chuàng)AI+時代”的主旨高調(diào)亮相,展示了企業(yè)SATA SSD、LPCAMM2、SOCAMM2、UFS4.1、DDR4等重磅產(chǎn)品。電子發(fā)燒友記者親自現(xiàn)場采訪,與技術(shù)大咖交流,為大家分享這些重磅產(chǎn)品的“含金量”。
    的頭像 發(fā)表于 10-17 09:00 ?1.4w次閱讀
    強勢進入企業(yè)SATA SSD賽道!江波龍有哪些<b class='flag-5'>殺手锏</b>,加入中移動產(chǎn)業(yè)鏈

    UWB技術(shù)正迅速崛起!出貨千萬顆,馳芯半導體有哪些殺手锏產(chǎn)品?

    電子發(fā)燒友原創(chuàng) 章鷹 2025年,更多搭載UWB的芯片產(chǎn)品出現(xiàn)。小米5月發(fā)布的“玄戒O1“處理器支持UWB超寬帶互聯(lián)。6月26日,國內(nèi)UWB車規(guī)芯片方案提供商長沙馳芯半導體傳來喜訊,其CX500
    的頭像 發(fā)表于 09-10 09:20 ?9567次閱讀
    UWB技術(shù)正迅速崛起!出貨千萬顆,馳芯半導體有哪些<b class='flag-5'>殺手锏</b>產(chǎn)品?

    aicube的n卡gpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當還是只能看到默認的gpu0,顯示不了gpu1
    發(fā)表于 07-25 08:18

    瑞之辰傳感器:從“卡脖子”到“殺手锏”的技術(shù)突圍

    壓力傳感器的國產(chǎn)化替代,將這一“卡脖子”難題逐步轉(zhuǎn)變?yōu)樽陨淼募夹g(shù)“殺手锏”。破解“卡脖子”的技術(shù)密碼當動力電池安全監(jiān)測需要精度達1%FS的微型壓力傳感器時,當工業(yè)自動化
    的頭像 發(fā)表于 07-01 17:06 ?2252次閱讀
    瑞之辰傳感器:從“卡脖子”到“<b class='flag-5'>殺手锏</b>”的技術(shù)突圍

    安富利低功耗傳感器解決方案助力可穿戴設備創(chuàng)新

    大規(guī)模商用的貼身醫(yī)療終端。再看去年華為WATCH D2海外亮相,直接祭出24小時動態(tài)血壓監(jiān)測的殺手锏。從心電圖(ECG)、血氧到車禍檢測,再到血壓監(jiān)測,智能手表這波操作,簡直就是你的“賽博扁鵲”本鵲!
    的頭像 發(fā)表于 05-07 14:23 ?2058次閱讀

    NVIDIA NVLink 深度解析

    了現(xiàn)代計算工作負載日益增長的需求。與通用性 PCIe 相比,NVLink 專為滿足高性能計算和人工智能領(lǐng)域中緊密耦合的 GPU 所需的大規(guī)模數(shù)據(jù)交換而設計。這項技術(shù)對于充分發(fā)揮百億億次級計算的潛力以及
    的頭像 發(fā)表于 05-06 18:14 ?5669次閱讀
    乾安县| 重庆市| 大兴区| 桐庐县| 杭州市| 辽宁省| 肇源县| 页游| 金昌市| 雅安市| 沅陵县| 延寿县| 九台市| 大化| 兴义市| 项城市| 巩义市| 合肥市| 金塔县| 扶沟县| 石河子市| 永宁县| 老河口市| 泰安市| 文化| 渝中区| 扬州市| 霍州市| 太康县| 吉木乃县| 宿州市| 桐梓县| 建昌县| 辰溪县| 渭源县| 蛟河市| 邵阳县| 吉隆县| 密云县| 乌拉特后旗| 康平县|