哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從TPU v1到Trillium TPU,蘋果等科技公司使用谷歌TPU進(jìn)行AI計(jì)算

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2024-07-31 01:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)7月30日消息,蘋果公司周一在一篇技術(shù)論文中表示,支撐其人工智能系統(tǒng)Apple Intelligence的兩個(gè)人工智能模型是在谷歌設(shè)計(jì)的云端芯片上進(jìn)行預(yù)訓(xùn)練的。這表明,在訓(xùn)練尖端人工智能方面,大型科技公司正在尋找英偉達(dá)以外的替代品。

不斷迭代的谷歌TPU芯片

隨著機(jī)器學(xué)習(xí)算法,特別是深度學(xué)習(xí)算法在各個(gè)領(lǐng)域的廣泛應(yīng)用,對于高效、低功耗的AI計(jì)算硬件需求日益增長。傳統(tǒng)的CPUGPU在處理這些算法時(shí)存在效率較低的問題,促使谷歌等科技巨頭開始探索專用AI加速芯片的研發(fā)。

谷歌在2015年左右開始規(guī)劃開發(fā)新的專用架構(gòu)處理器,旨在優(yōu)化機(jī)器學(xué)習(xí)算法中的張量運(yùn)算執(zhí)行過程。經(jīng)過快速迭代和研發(fā),谷歌于2016年發(fā)布了首個(gè)TPU版本(TPU v1),專門用于大規(guī)模機(jī)器學(xué)習(xí)加速。

TPU v1部署于數(shù)據(jù)中心,用于加速神經(jīng)網(wǎng)絡(luò)的推理階段。擁有65536個(gè)8-bit MAC(矩陣乘單元),峰值性能為92 TOPS(每秒萬億次操作),以及28 MiB的片上內(nèi)存空間。相比于CPU和GPU,TPU v1在響應(yīng)時(shí)間和能效比上表現(xiàn)出色,能夠顯著提升神經(jīng)網(wǎng)絡(luò)的推理速度。

隨著技術(shù)的不斷進(jìn)步,谷歌相繼推出了多個(gè)TPU版本,不斷提升性能和功能。例如,TPU v2和TPU v3被設(shè)計(jì)為服務(wù)端AI推理和訓(xùn)練芯片,支持更復(fù)雜的AI任務(wù)。TPU v4則進(jìn)一步增強(qiáng)了擴(kuò)展性和靈活性,支持大規(guī)模AI計(jì)算集群的構(gòu)建。

在面對爭議和質(zhì)疑后,谷歌推出了TPU v5e版本。TPU v5e在架構(gòu)上進(jìn)行了調(diào)整,采用單TensorCore架構(gòu),并在INT8峰值算力上有所提升。盡管在BF16峰值算力上略低于前代版本,但TPU v5e更適用于推理任務(wù),并體現(xiàn)了谷歌在AI算力服務(wù)市場的戰(zhàn)略選擇。

在今年5月的I/O開發(fā)者大會(huì)上,谷歌又發(fā)布了第六代張量處理單元 (TPU) ,稱為Trillium。Trillium TPU 可以更快地訓(xùn)練下一波基礎(chǔ)模型,并以更少的延遲和更低的成本為這些模型提供服務(wù)。至關(guān)重要的是,Trillium TPU 的能效比 TPU v5e 高出 67% 以上。

值得一提的是,Trillium 可以在單個(gè)高帶寬、低延遲 Pod 中擴(kuò)展到多達(dá) 256 個(gè) TPU。除了這種 Pod 級(jí)可擴(kuò)展性之外,借助多切片技術(shù)和Titanium 智能處理單元 (IPU ),Trillium TPU 還可以擴(kuò)展到數(shù)百個(gè) Pod,從而連接建筑物級(jí)超級(jí)計(jì)算機(jī)中的數(shù)萬個(gè)芯片,這些芯片通過每秒數(shù) PB 的速度互連數(shù)據(jù)中心網(wǎng)絡(luò)。

谷歌表示,Trillium TPU 將為下一波 AI 模型和代理提供動(dòng)力,包括自動(dòng)駕駛汽車公司Nuro、藥物發(fā)現(xiàn)公司Deep Genomics、德勤等企業(yè)也采用其TPU產(chǎn)品進(jìn)行應(yīng)用。

越來越多企業(yè)使用谷歌TPU芯片滿足AI計(jì)算

據(jù)谷歌官方信息,其最新TPU的運(yùn)行成本每小時(shí)不足2美元,但客戶需提前三年預(yù)訂以確保使用。自2015年專為內(nèi)部工作負(fù)載設(shè)計(jì)的TPU問世以來,谷歌于2017年將其向公眾開放,如今,TPU已成為人工智能領(lǐng)域最為成熟和先進(jìn)的定制芯片之一。

谷歌在其多個(gè)設(shè)施中使用了自研的TPU(Tensor Processing Unit)芯片。谷歌云平臺(tái)廣泛使用了TPU芯片來支持其AI基礎(chǔ)設(shè)施。這些芯片被用于加速機(jī)器學(xué)習(xí)模型的訓(xùn)練和推理過程,提供高性能和高效的計(jì)算能力。通過谷歌云平臺(tái),用戶可以訪問到基于TPU芯片的虛擬機(jī)實(shí)例(VM),用于訓(xùn)練和部署自己的機(jī)器學(xué)習(xí)模型。

除此之外,已經(jīng)有多家公司使用谷歌的TPU芯片,如蘋果,蘋果在最新發(fā)表的技術(shù)論文中承認(rèn),公司采用了谷歌張量處理單元(TPU)訓(xùn)練其人工智能模型。

在周一發(fā)布的技術(shù)論文中,蘋果詳細(xì)介紹為支持蘋果個(gè)人智能化系統(tǒng)Apple Intelligence而開發(fā)了一些基礎(chǔ)語言模型,包括一個(gè)用于在設(shè)備上高效運(yùn)行的約30億參數(shù)模型——端側(cè)“蘋果基礎(chǔ)模型”(AFM),以及一個(gè)為蘋果云端AI架構(gòu)“私有云計(jì)算”(Private Cloud Compute)而設(shè)計(jì)的大型服務(wù)器語言模型——服務(wù)器AFM。

蘋果披露,訓(xùn)練模型采用了谷歌研發(fā)的第四代AI ASIC芯片TPUv4和更新一代的芯片TPUv5。蘋果在8192塊TPUv4 芯片上從無到有訓(xùn)練服務(wù)器AFM,使用4096的序列長度和4096個(gè)序列的批量大小,進(jìn)行6.3萬億token訓(xùn)練。端側(cè)AFM在2048塊TPUv5p芯片上進(jìn)行訓(xùn)練。

此外,Anthropic這家被譽(yù)為“OpenAI勁敵”的人工智能初創(chuàng)公司,據(jù)悉是谷歌TPU芯片的早期用戶之一。Anthropic使用谷歌Cloud TPU v5e芯片為其大語言模型(LLM)Claude提供硬件支持,以加速模型的訓(xùn)練和推理過程。Hugging Face和AssemblyAI這兩家同樣在人工智能領(lǐng)域備受矚目的初創(chuàng)公司也在大規(guī)模使用谷歌TPU芯片來支持其AI應(yīng)用。

另外,許多科研機(jī)構(gòu)也在使用谷歌TPU芯片來支持其AI相關(guān)的研究項(xiàng)目。這些機(jī)構(gòu)可以利用TPU芯片的高性能計(jì)算能力來加速實(shí)驗(yàn)過程,推動(dòng)科研進(jìn)展。一些教育機(jī)構(gòu)也將谷歌TPU芯片用于教學(xué)和培訓(xùn)目的,幫助學(xué)生和研究人員學(xué)習(xí)和掌握機(jī)器學(xué)習(xí)技術(shù)。

寫在最后

長期以來,英偉達(dá)的高性能GPU在高端人工智能模型訓(xùn)練市場占據(jù)主導(dǎo)地位,包括OpenAI、微軟、Anthropic在內(nèi)的多家科技公司紛紛采用其GPU來加速模型訓(xùn)練。但在過去幾年里,英偉達(dá)GPU始終供不應(yīng)求,為此谷歌、Meta、甲骨文及特斯拉等企業(yè)都在自研芯片,以滿足各自人工智能系統(tǒng)與產(chǎn)品開發(fā)的需求。

不僅如此,如谷歌,雖然TPU最初是為內(nèi)部工作負(fù)載而創(chuàng)建,而其憑借著諸多優(yōu)勢,現(xiàn)在正得到更廣泛的應(yīng)用。隨著人工智能技術(shù)的不斷發(fā)展和市場的不斷擴(kuò)大,未來可能會(huì)有更多的企業(yè)選擇使用谷歌TPU芯片來滿足其AI計(jì)算需求。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6257

    瀏覽量

    111935
  • 蘋果
    +關(guān)注

    關(guān)注

    61

    文章

    24608

    瀏覽量

    208719
  • TPU
    TPU
    +關(guān)注

    關(guān)注

    0

    文章

    171

    瀏覽量

    21712
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    直擊英偉達(dá)腹地?谷歌TPU v7開放部署,催生OCS產(chǎn)業(yè)鏈紅利

    Processing Unit, TPU)構(gòu)建了一套完整的AI算力基礎(chǔ)設(shè)施體系。 ? 11月,谷歌宣布第七代 TPU v7(代號(hào) Iron
    的頭像 發(fā)表于 11-27 08:53 ?9661次閱讀
    直擊英偉達(dá)腹地?<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b> <b class='flag-5'>v</b>7開放部署,催生OCS產(chǎn)業(yè)鏈紅利

    什么是TPU?萬協(xié)通帶你看懂AI算力的“變形金剛”

    ”——TPU(Tensor Processing Unit)。 今天,作為國產(chǎn)可重構(gòu)TPU芯片的先行者,萬協(xié)通將帶你剝開晦澀的技術(shù)外殼,看懂這塊決定AI未來的核心硬件,以及中國芯片如何換道超車,上演一場精彩的“變形記”。
    的頭像 發(fā)表于 01-13 13:22 ?448次閱讀
    什么是<b class='flag-5'>TPU</b>?萬協(xié)通帶你看懂<b class='flag-5'>AI</b>算力的“變形金剛”

    AI芯片大單!Anthropic博通采購100萬顆TPU v7p芯片

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日消息,AI企業(yè)Anthropic將直接博通采購近100萬顆TPU v7?pIronwood AI芯片,本
    的頭像 發(fā)表于 01-06 08:38 ?1.1w次閱讀

    AI硬件全景解析:CPU、GPU、NPU、TPU的差異化之路,一文看懂!?

    CPU作為“通用基石”,支撐所有設(shè)備的基礎(chǔ)運(yùn)行;GPU憑借并行算力,成為AI訓(xùn)練與圖形處理的“主力”;TPU在Google生態(tài)中深耕云端大模型訓(xùn)練;NPU則讓AI“云端”走向“身邊”
    的頭像 發(fā)表于 12-17 17:13 ?2163次閱讀
    <b class='flag-5'>AI</b>硬件全景解析:CPU、GPU、NPU、<b class='flag-5'>TPU</b>的差異化之路,一文看懂!?

    谷歌云發(fā)布最強(qiáng)自研TPU,性能比前代提升4倍

    精心設(shè)計(jì),能夠輕松處理大型模型訓(xùn)練到實(shí)時(shí)聊天機(jī)器人運(yùn)行以及AI智能體操作各類復(fù)雜任務(wù)。 ? 谷歌在新聞稿中著重強(qiáng)調(diào),“Ironwood”是專為應(yīng)對最嚴(yán)苛的工作負(fù)載而打造的。無論是大
    的頭像 發(fā)表于 11-13 07:49 ?8899次閱讀
    <b class='flag-5'>谷歌</b>云發(fā)布最強(qiáng)自研<b class='flag-5'>TPU</b>,性能比前代提升4倍

    擁抱DeepSeek開源生態(tài)| 算能TPU接入TileLang,集結(jié)北大復(fù)旦山大頂尖團(tuán)隊(duì)!

    近日,DeepSeekV3.2-Exp上線,官宣支持國產(chǎn)AI算子編程語言TileLang并發(fā)布了針對V3.2的算子示例,這意味著支持“同一語義、跨多后端”的TileLang得到了權(quán)威認(rèn)可,基于算能
    的頭像 發(fā)表于 10-03 19:08 ?1590次閱讀
    擁抱DeepSeek開源生態(tài)| 算能<b class='flag-5'>TPU</b>接入TileLang,集結(jié)北大復(fù)旦山大頂尖團(tuán)隊(duì)!

    TPU無人機(jī)油囊:輕量化燃油存儲(chǔ)的革命性突破

    在無人機(jī)技術(shù)飛速發(fā)展的今天,燃油存儲(chǔ)系統(tǒng)的性能直接影響飛行器的續(xù)航能力、安全性和環(huán)境適應(yīng)性。傳統(tǒng)金屬或復(fù)合材料燃油箱雖然具備一定的可靠性,但重量大、空間利用率低、抗沖擊性不足問題逐漸成為制約長航
    的頭像 發(fā)表于 09-25 11:17 ?705次閱讀
    <b class='flag-5'>TPU</b>無人機(jī)油囊:輕量化燃油存儲(chǔ)的革命性突破

    輕量化革命:TPU油囊為無人機(jī)續(xù)航解鎖30%+減重空間

    ,但其難以克服的重量負(fù)擔(dān)、空間桎梏與抗沖擊短板,正日益成為長航時(shí)無人機(jī)翱翔藍(lán)天的沉重枷鎖。在此背景下,一種以革命性材料TPU(熱塑性聚氨酯)打造的柔性油囊,正以其顛
    的頭像 發(fā)表于 09-25 11:03 ?799次閱讀
    輕量化革命:<b class='flag-5'>TPU</b>油囊為無人機(jī)續(xù)航解鎖30%+減重空間

    高分子材料創(chuàng)新應(yīng)用:TPU油囊技術(shù)原理與性能特征全面解讀

    在無人機(jī)產(chǎn)業(yè)向長航時(shí)、高可靠、多場景深度進(jìn)軍的時(shí)代洪流中,續(xù)航與安全成為決定其應(yīng)用廣度的核心命門,而TPU柔性油囊正在成為打破傳統(tǒng)油箱限制的革命性解決方案。
    的頭像 發(fā)表于 09-24 11:24 ?815次閱讀
    高分子材料創(chuàng)新應(yīng)用:<b class='flag-5'>TPU</b>油囊技術(shù)原理與性能特征全面解讀

    AI芯片:科技探索與AGI愿景》—— 深入硬件核心的AGI指南

    存內(nèi)計(jì)算、異構(gòu)集成、光計(jì)算前沿技術(shù)的突破性價(jià)值。書中配以大量精心繪制的芯片架構(gòu)圖(如圖1),將TPU、NPU
    發(fā)表于 09-17 09:29

    基于碳納米材料的TPU導(dǎo)電長絲制備與性能研究

    、金屬材料與復(fù)合材料各領(lǐng)域的研究開發(fā)、工藝優(yōu)化與質(zhì)量監(jiān)控.基于碳納米材料的TPU導(dǎo)電長絲制備與性能研究【江南大學(xué)趙樹強(qiáng)】基于碳納米材料的TPU導(dǎo)電長絲制備與性能研究上海
    的頭像 發(fā)表于 07-11 10:21 ?614次閱讀
    基于碳納米材料的<b class='flag-5'>TPU</b>導(dǎo)電長絲制備與性能研究

    AI芯片:加速人工智能計(jì)算的專用硬件引擎

    處理應(yīng)用落地的關(guān)鍵硬件基礎(chǔ)。 ? AI芯片的核心技術(shù)特點(diǎn) ? ? AI芯片的設(shè)計(jì)重點(diǎn)在于提升計(jì)算效率,主要技術(shù)特點(diǎn)包括: ? 1. ? 并
    的頭像 發(fā)表于 07-09 15:59 ?1920次閱讀

    TPU編程競賽系列|2025中國國際大學(xué)生創(chuàng)新大賽產(chǎn)業(yè)命題賽道,算能11項(xiàng)命題入選!

    參賽者使用和選擇,我們誠摯邀請廣大開發(fā)者前來挑戰(zhàn)!算能命題2025中國國際大學(xué)生創(chuàng)新大賽產(chǎn)業(yè)命題賽道——算能命題序號(hào)賽題名稱2453基于RISC-V架構(gòu)的AI計(jì)算
    的頭像 發(fā)表于 06-05 17:03 ?1577次閱讀
    <b class='flag-5'>TPU</b>編程競賽系列|2025中國國際大學(xué)生創(chuàng)新大賽產(chǎn)業(yè)命題賽道,算能11項(xiàng)命題入選!

    智算加速卡是什么東西?它真能在AI戰(zhàn)場上干掉GPU和TPU!

    隨著AI技術(shù)火得一塌糊涂,大家都在談"大模型"、"AI加速"、"智能計(jì)算",可真到了落地環(huán)節(jié),算力才是硬通貨。你有沒有發(fā)現(xiàn),現(xiàn)在越來越多的AI企業(yè)不光用GPU,也不怎么迷信
    的頭像 發(fā)表于 06-05 13:39 ?1857次閱讀
    智算加速卡是什么東西?它真能在<b class='flag-5'>AI</b>戰(zhàn)場上干掉GPU和<b class='flag-5'>TPU</b>!

    TPU處理器的特性和工作原理

    張量處理單元(TPU,Tensor Processing Unit)是一種專門為深度學(xué)習(xí)應(yīng)用設(shè)計(jì)的硬件加速器。它的開發(fā)源于對人工智能(AI)和機(jī)器學(xué)習(xí)應(yīng)用的需求,尤其是深度學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)計(jì)算。
    的頭像 發(fā)表于 04-22 09:41 ?4852次閱讀
    <b class='flag-5'>TPU</b>處理器的特性和工作原理
    合肥市| 庆阳市| 绥阳县| 庄浪县| 临高县| 肥城市| 河东区| 景洪市| 章丘市| 永济市| 广河县| 桐柏县| 临城县| 泸州市| 同江市| 岚皋县| 通山县| 滦南县| 会同县| 河津市| 桂平市| 南宫市| 临澧县| 军事| 武汉市| 化隆| 衡阳县| 夏河县| 饶河县| 和平县| 巴楚县| 海伦市| 醴陵市| 平武县| 彩票| 淮安市| 南川市| 延安市| 大港区| 二连浩特市| 黄平县|