哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Cerebras Systems宣布推出有史以來最大的芯片Wafer Scale Engine

M8kW_icbank ? 來源:半導(dǎo)體行業(yè)觀察 ? 2019-12-10 14:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

昨天,初創(chuàng)公司Cerebras Systems宣布推出有史以來最大的芯片Wafer Scale Engine(WSE)。

據(jù)悉,WSE擁有1.2萬億個(gè)晶體管,這是一個(gè)什么概念呢?比較一下,1971年英特爾首款4004處理器擁有2300個(gè)晶體管,最近,AMD推出的最新處理器擁有320億個(gè)晶體管。由此可見WSE規(guī)模之龐大。

大多數(shù)芯片是在12英寸硅晶圓上制造的,并在芯片工廠中批量處理。但Cerebras Systems芯片是在單個(gè)晶圓上通過互聯(lián)實(shí)現(xiàn)的單芯片。這些互連設(shè)計(jì)使其全部保持高速運(yùn)行,可使萬億個(gè)晶體管全部一起工作。

Cerebras Wafer Scale Engine專門針對處理人工智能應(yīng)用程序而設(shè)計(jì)的。該公司本周正在加利福尼亞州帕洛阿爾托的斯坦福大學(xué)舉行的Hot Chips會議上討論這項(xiàng)設(shè)計(jì)。

此前,三星已經(jīng)制造了一個(gè)閃存芯片,即eUFS,擁有2萬億個(gè)晶體管。但Cerebras芯片擁有400,000個(gè)核心,42,225平方毫米。它比最大的Nvidia圖形處理單元大 56.7倍,該單元的尺寸為815平方毫米和211億個(gè)晶體管。

與傳統(tǒng)芯片相比,WSE還包含3000倍的高速片上存儲器,并且具有10000倍的存儲器帶寬。

該芯片來自Andrew Feldman領(lǐng)導(dǎo)的團(tuán)隊(duì),后者曾創(chuàng)建微型服務(wù)器公司SeaMicro,并以3.34億美元的價(jià)格出售給了AMD。

芯片尺寸在AI中非常重要,因?yàn)榇笮酒梢愿斓靥幚硇畔ⅲ诟痰臅r(shí)間內(nèi)產(chǎn)生答案。減少訓(xùn)練時(shí)間,使研究人員能夠測試更多想法,使用更多數(shù)據(jù)并解決新問題。谷歌,F(xiàn)acebook,OpenAI,騰訊,百度和許多專業(yè)人士都認(rèn)為,今天人工智能的主要限制是訓(xùn)練需要很長時(shí)間。因此,縮短訓(xùn)練時(shí)間就消除了整個(gè)行業(yè)進(jìn)步的主要瓶頸。

當(dāng)然,芯片制造商通常不會制造如此大的芯片。在單個(gè)晶圓上,在制造過程中通常會產(chǎn)生一些雜質(zhì),雜質(zhì)會導(dǎo)致芯片發(fā)生故障。如果晶圓上只有一個(gè)芯片,它有雜質(zhì)的幾率是100%,雜質(zhì)會使芯片失效。但Cerebras設(shè)計(jì)的芯片是有冗余的,因此一種雜質(zhì)不會破壞整個(gè)芯片。

WSE有很多創(chuàng)新,通過解決限制芯片尺寸的數(shù)十年的技術(shù)挑戰(zhàn) - 例如交叉光罩連接,良率,功率輸送,以及封裝等,Cerebras Systems首席執(zhí)行官費(fèi)爾德曼說。“每個(gè)架構(gòu)決策都是為了優(yōu)化AI工作的性能。結(jié)果是,Cerebras WSE根據(jù)工作量提供了數(shù)百或數(shù)千倍于現(xiàn)有解決方案的性能,只需很小的功耗和空間?!?/p>

WSE通過加速神經(jīng)網(wǎng)絡(luò)訓(xùn)練的所有元素來實(shí)現(xiàn)這些性能提升。神經(jīng)網(wǎng)絡(luò)是多級計(jì)算反饋回路。較快的輸入在循環(huán)中移動(dòng),循環(huán)學(xué)習(xí)的速度越快,從而減少了訓(xùn)練時(shí)間。

Linley Group首席分析師Linley Gwennap在一份聲明中說:“Cerebras憑借其晶圓級技術(shù)實(shí)現(xiàn)了巨大的飛躍,在單片晶圓上實(shí)現(xiàn)了更多的處理性能?!?為了實(shí)現(xiàn)這一壯舉,該公司已經(jīng)解決了一系列工程難題,包括實(shí)施高速芯片到芯片通信,解決制造缺陷,封裝如此大的芯片,以及電源和冷卻等問題。通過將各種學(xué)科的頂級工程師聚集在一起,Cerebras在短短幾年內(nèi)創(chuàng)造了新技術(shù)并交付了產(chǎn)品。

據(jù)悉,該芯片面積比最大的GPU多56.7倍,Cerebras WSE提供更多內(nèi)核進(jìn)行計(jì)算,更多內(nèi)存靠近內(nèi)核,因此內(nèi)核可以高效運(yùn)行。由于這些大量的內(nèi)核和內(nèi)存位于單個(gè)芯片上,因此所有通信都在芯片內(nèi)進(jìn)行,這意味著它的低延遲通信帶寬是巨大的,因此內(nèi)核組可以以最高效率進(jìn)行協(xié)作。

Cerebras WSE中的46,225平方毫米的硅包含400,000個(gè)AI優(yōu)化,無緩存,無開銷的計(jì)算內(nèi)核和18千兆字節(jié)的本地、分布式、超高速SRAM內(nèi)存,內(nèi)存帶寬為每秒9 PB。這些內(nèi)核通過細(xì)粒度、全硬件、片上網(wǎng)狀連接通信網(wǎng)絡(luò)連接在一起,可提供每秒100 petabits的總帶寬。更多內(nèi)核,更多本地內(nèi)存和低延遲高帶寬結(jié)構(gòu)共同構(gòu)成了加速AI工作的最佳架構(gòu)。

更多核心

WSE包含400,000個(gè)AI優(yōu)化的計(jì)算核心。被稱為稀疏線性代數(shù)核心的SLAC,計(jì)算核心靈活、可編程,并針對支持所有神經(jīng)網(wǎng)絡(luò)計(jì)算的稀疏線性代數(shù)進(jìn)行了優(yōu)化。SLAC的可編程性確保內(nèi)核可以在不斷變化的機(jī)器學(xué)習(xí)領(lǐng)域中運(yùn)行所有神經(jīng)網(wǎng)絡(luò)算法

由于稀疏線性代數(shù)核心針對神經(jīng)網(wǎng)絡(luò)計(jì)算基元進(jìn)行了優(yōu)化,因此它們可實(shí)現(xiàn)最佳利用率 - 通常是GPU的三倍或四倍。此外,WSE核心包括Cerebras發(fā)明的稀疏性收集技術(shù),以加速稀疏工作負(fù)載(包含零的工作負(fù)載)的計(jì)算性能,如深度學(xué)習(xí)。

零在深度學(xué)習(xí)計(jì)算中很普遍。通常,要相乘的向量和矩陣中的大多數(shù)元素都是零。然而,乘以零是浪費(fèi)硅、功率和時(shí)間,因?yàn)闆]有新的信息。

因?yàn)镚PU和張量處理單元是密集的執(zhí)行引擎 - 設(shè)計(jì)為永不遇到零的引擎 - 它們即使在零時(shí)也會乘以每個(gè)元素。當(dāng)50%-98%的數(shù)據(jù)為零時(shí),如深度學(xué)習(xí)中的情況一樣,大多數(shù)乘法都被浪費(fèi)了。由于Cerebras稀疏線性代數(shù)核不會乘以零,所有零數(shù)據(jù)都會被濾除,并且可以在硬件中跳過。

存儲

內(nèi)存是每個(gè)計(jì)算機(jī)體系結(jié)構(gòu)的關(guān)鍵組件。更接近計(jì)算的內(nèi)存轉(zhuǎn)換為更快的計(jì)算,更低的延遲和更好的數(shù)據(jù)移動(dòng)功效。高性能深度學(xué)習(xí)需要大量計(jì)算,并且頻繁訪問數(shù)據(jù)。這需要計(jì)算核心和存儲器之間的緊密接近,這在GPU中并非如此,其中絕大多數(shù)存儲器是很緩慢的,且在片外。

Cerebras Wafer Scale Engine包含更多內(nèi)核,具有比迄今為止任何芯片更多的本地內(nèi)存,并且在一個(gè)時(shí)鐘周期內(nèi)可以通過其核心訪問18GB的片上內(nèi)存。WSE上的核心本地內(nèi)存集合可提供每秒9PB的內(nèi)存帶寬 - 比領(lǐng)先的圖形處理單元多3,000倍的片上內(nèi)存和10,000倍的內(nèi)存帶寬。

通信

Swarm通信結(jié)構(gòu)是WSE上使用的處理器間通信結(jié)構(gòu),它可以傳統(tǒng)通信技術(shù)的功耗的一小部分實(shí)現(xiàn)突破性帶寬和低延遲。Swarm提供低延遲、高帶寬的2D網(wǎng)格,可連接WSE上的所有400,000個(gè)核心,每秒帶寬為100 petabits。

路由方面,Swarm為每個(gè)神經(jīng)網(wǎng)絡(luò)提供獨(dú)特的優(yōu)化通信路徑。軟件根據(jù)正在運(yùn)行的特定用戶定義的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),配置通過400,000個(gè)核心的最佳通信路徑以連接處理器。

Cerebras WSE的總帶寬為每秒100 petabits。不需要諸如TCP / IP和MPI之類的通信協(xié)議支持,因此避免了它們的性能損失。該架構(gòu)中的通信能量成本遠(yuǎn)低于每比特1焦耳,這比GPU低近兩個(gè)數(shù)量級。通過結(jié)合大量帶寬和極低的延遲,Swarm通信結(jié)構(gòu)使Cerebras WSE能夠比任何當(dāng)前可用的解決方案更快地學(xué)習(xí)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54409

    瀏覽量

    469082
  • 晶體管
    +關(guān)注

    關(guān)注

    78

    文章

    10437

    瀏覽量

    148560
  • Systems
    +關(guān)注

    關(guān)注

    0

    文章

    28

    瀏覽量

    20958

原文標(biāo)題:反其道而行,世界最大芯片誕生

文章出處:【微信號:icbank,微信公眾號:icbank】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    Melexis宣布推出免代碼三相風(fēng)扇驅(qū)動(dòng)芯片MLX80339

    Melexis宣布推出免代碼三相風(fēng)扇驅(qū)動(dòng)芯片MLX80339,旨在為全球市場提供高效、低噪聲的電機(jī)控制方案。MLX80339內(nèi)置可通過簡潔界面進(jìn)行配置的預(yù)驗(yàn)證電機(jī)控制邏輯,無需進(jìn)行繁瑣的軟件開發(fā)即可快速部署無刷直流(BLDC)電
    的頭像 發(fā)表于 04-07 09:50 ?1145次閱讀

    馬斯克擬建全球最大芯片廠,進(jìn)軍2nm芯片制造!

    3月22日,馬斯克宣布SpaceX、特斯拉攜手人工智能公司xAI,正在建設(shè)史上規(guī)模最大芯片制造工廠“Terafab”,這是私營公司計(jì)劃的最大半導(dǎo)體制造業(yè)務(wù)之一。
    的頭像 發(fā)表于 03-25 16:14 ?395次閱讀

    是德科技推出一系列全新Scale-up驗(yàn)證解決方案

    是德科技(NYSE: KEYS )推出一系列全新Scale-up驗(yàn)證解決方案,旨在幫助人工智能數(shù)據(jù)中心運(yùn)營商應(yīng)對計(jì)算集群日益密集復(fù)雜化過程中不斷加劇的帶寬、延遲及互操作性挑戰(zhàn)。 該解決方案支持新興
    的頭像 發(fā)表于 03-06 10:01 ?621次閱讀
    是德科技<b class='flag-5'>推出</b>一系列全新<b class='flag-5'>Scale</b>-up驗(yàn)證解決方案

    Power Integrations推出新款SCALE-iFlex LT門極驅(qū)動(dòng)器

    Power Integrations的SCALE-iFlex LT即插即用型門極驅(qū)動(dòng)器系統(tǒng)設(shè)計(jì)用來優(yōu)化功率模塊的并聯(lián)運(yùn)行,現(xiàn)已提供光纖接口選項(xiàng)。該新功能增強(qiáng)了系統(tǒng)對電磁干擾(EMI)的抗擾能力,并為儲能系統(tǒng)和軌道交通輔助變換器的機(jī)械布局提供了更大的靈活性。
    的頭像 發(fā)表于 02-28 09:41 ?349次閱讀
    Power Integrations<b class='flag-5'>推出</b>新款<b class='flag-5'>SCALE</b>-iFlex LT門極驅(qū)動(dòng)器

    Credo發(fā)布新品Blue Heron 224G AI Scale-Up Retimer芯片

    發(fā)布新品:Blue Heron 224G AI Scale?Up Retimer芯片,該產(chǎn)品針對需求日益攀升的線纜與 PCB 背板連接應(yīng)用進(jìn)行專門優(yōu)化,全面支持 UALink、ESUN 與以太網(wǎng)協(xié)議。
    的頭像 發(fā)表于 02-06 15:32 ?623次閱讀

    DSP717HF Wafer植球錫膏重磅推薦

    在先進(jìn)封裝工藝不斷升級的背景下,植球材料的穩(wěn)定性、精度與潔凈度,正成為影響良率的關(guān)鍵因素。東莞市大為新材料技術(shù)有限公司推出高性能Wafer植球錫膏——DSP717HF,為高端封裝提供可靠國產(chǎn)化
    的頭像 發(fā)表于 02-05 14:17 ?558次閱讀
    DSP717HF <b class='flag-5'>Wafer</b>植球錫膏重磅推薦

    THine發(fā)布無光學(xué)DSP芯片組,賦能下一代Scale-Up型AI網(wǎng)絡(luò)“Slow and Wide”互聯(lián)

    全球領(lǐng)先的無晶圓廠半導(dǎo)體供應(yīng)商 THine Electronics, Inc.(東京證券交易所代碼:6769,簡稱 “THine”)今日宣布,正式推出采用自主研發(fā) ZERO EYE SKEW? 技術(shù)
    的頭像 發(fā)表于 02-04 16:26 ?349次閱讀

    基于Vitis Model Composer完成全流程AI Engine開發(fā)

    基于Vitis Model Composer進(jìn)行AI Engine(AIE)開發(fā),核心優(yōu)勢體現(xiàn)在AIE專屬優(yōu)化、開發(fā)流程簡化、靈活的適配性、高效驗(yàn)證及量產(chǎn)適配等方面。
    的頭像 發(fā)表于 12-31 11:20 ?6309次閱讀
    基于Vitis Model Composer完成全流程AI <b class='flag-5'>Engine</b>開發(fā)

    IBM Storage Scale System 6000煥新升級

    沒有數(shù)據(jù)的 AI 工廠就像沒有燃料的引擎,根本無法運(yùn)轉(zhuǎn)。IBM Storage Scale System 6000 的全局命名空間和 Active File Management (AFM) 功能
    的頭像 發(fā)表于 11-30 09:12 ?774次閱讀

    谷歌與耶魯大學(xué)合作發(fā)布最新C2S-Scale 27B模型

    我們很榮幸發(fā)布與耶魯大學(xué)合作研究的 Cell2Sentence-Scale 27B (C2S-Scale),這是一個(gè)新的 270 億參數(shù)基礎(chǔ)模型,旨在理解單個(gè)細(xì)胞的 "語言"。C2S-Scale 建立在 Gemma 開放模型系列
    的頭像 發(fā)表于 11-06 10:35 ?1007次閱讀

    Vicor攜手Microgate打造全球最大地面光學(xué)望遠(yuǎn)鏡

    在智利沙漠的中心 Cerro Armazones 山上,美國公司 Vicor 和意大利公司 Microgate 這兩家技術(shù)領(lǐng)導(dǎo)者正在攜手打造有史以來最大的地面光學(xué)望遠(yuǎn)鏡 —— 極大望遠(yuǎn)鏡 (ELT)。得益于高密度電源系統(tǒng)和革命性的自適應(yīng)光學(xué)技術(shù),這一工程壯舉有望以前所未有
    的頭像 發(fā)表于 09-26 14:01 ?896次閱讀

    NVIDIA推出Spectrum-XGS以太網(wǎng)技術(shù)

    NVIDIA 今日宣布推出 NVIDIA Spectrum-XGS 以太網(wǎng)。這項(xiàng)跨區(qū)域擴(kuò)展(scale-across)技術(shù)可將多個(gè)分布式數(shù)據(jù)中心組合成一個(gè)十億瓦級 AI 超級工廠。
    的頭像 發(fā)表于 08-27 12:51 ?1467次閱讀

    比亞迪上市以來最大分紅 豪擲120億

    ,比亞迪將拿出?120 億元回報(bào)股東。這是比亞迪上市以來最大分紅金額。 公告顯示,比亞迪 在2024 年度的權(quán)益分派方案為:公司以總股本 3,039,065,855 股為基數(shù)(其中 A 股 1,811,265,855 股,H 股 1,227,800,000 股),向全體
    的頭像 發(fā)表于 07-28 16:51 ?863次閱讀

    ipa干燥wafer原理

    IPA干燥晶圓(Wafer)的原理主要基于異丙醇(IPA)的物理化學(xué)特性,通過蒸汽冷凝、混合置換和表面張力作用實(shí)現(xiàn)晶圓表面的高效脫水。以下是其核心原理和過程的分步解釋: 1. IPA蒸汽與水分的混合
    的頭像 發(fā)表于 06-11 10:38 ?2767次閱讀

    wafer清洗和濕法腐蝕區(qū)別一覽

    在半導(dǎo)體制造中,wafer清洗和濕法腐蝕是兩個(gè)看似相似但本質(zhì)不同的工藝步驟。為了能讓大家更好了解,下面我們就用具體來為大家描述一下其中的區(qū)別: Wafer清洗和濕法腐蝕是半導(dǎo)體制造中的兩個(gè)關(guān)鍵工藝
    的頭像 發(fā)表于 06-03 09:44 ?1049次閱讀
    屯留县| 长宁县| 祁连县| 鲜城| 台中县| 天峻县| 普格县| 黄冈市| 周口市| 葫芦岛市| 屏东市| 周至县| 绵竹市| 沂水县| 绥滨县| 华池县| 孟州市| 奈曼旗| 织金县| 仙游县| 金昌市| 开封市| 和静县| 上饶市| 皮山县| 庐江县| 洛浦县| 衢州市| 大英县| 广灵县| 临颍县| 纳雍县| 衡水市| 莲花县| 永善县| 中阳县| 巨野县| 安宁市| 唐海县| 闸北区| 平阴县|