哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮、英偉達(dá)微軟相繼發(fā)布2500億、5300億參數(shù)的巨量模型,超過GPT-3

Carol Li ? 來源:電子發(fā)燒友網(wǎng)整理 ? 作者:李彎彎 ? 2021-10-18 14:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

由于模型越來越大,訓(xùn)練過程中硬件的優(yōu)化變得尤為重要。從2019年下半年開始,各家分別開發(fā)出大規(guī)模并行訓(xùn)練、模型擴(kuò)展技術(shù),以期開發(fā)出更大的NLP模型。英偉達(dá)Megatron-LM、谷歌T5、微軟Turing-NLG相繼出現(xiàn)。

2020年6月OpenAI在發(fā)布了GPT-3,這是當(dāng)時(shí)訓(xùn)練的最大模型,具有1750億個(gè)參數(shù)。近段時(shí)間,浪潮、英偉達(dá)與微軟相繼發(fā)布2500億參數(shù)、5300億參數(shù)的巨量模型,超過GPT-3。

中國工程院院士王恩東認(rèn)為,人工智能的大模型時(shí)代已經(jīng)到來,利用先進(jìn)算法,整合大規(guī)模數(shù)據(jù),匯聚大量算力,訓(xùn)練出巨量人工智能模型是未來的發(fā)展方向……


英偉達(dá)與微軟聯(lián)合發(fā)布了5300億參數(shù)的“威震天-圖靈”

上周,英偉達(dá)與微軟聯(lián)合發(fā)布了5300億參數(shù)的“威震天-圖靈”自然語言生成模型(Megatron-TuringNLG)。據(jù)介紹,這樣的量級不僅讓它成為全球規(guī)模最大,同時(shí)也是性能最強(qiáng)的NLP模型。


訓(xùn)練過程一共使用了4480塊英偉達(dá)A100 GPU,最終使該模型在一系列自然語言任務(wù)中——包括文本預(yù)測、閱讀理解、常識(shí)推理、自然語言推理、詞義消歧——都獲得了前所未有的準(zhǔn)確率。

此模型簡稱MT-NLG,是微軟Turing NLG和英偉達(dá)Megatron-LM兩者的“繼任者”。Turing NLG由微軟于2020年2月推出,參數(shù)為170億;Megatron-LM來自英偉達(dá),2019年8月推出,參數(shù)83億。它倆在當(dāng)時(shí)分別是第一、二大規(guī)模的Transfomer架構(gòu)模型。

我們都知道大參數(shù)規(guī)模的語言模型效果會(huì)更好,但訓(xùn)練起來也很有挑戰(zhàn)性,比如:即使是最大容量的GPU,也存不下如此規(guī)模的參數(shù);如果不特別注意優(yōu)化算法、軟件和硬件堆棧,那么所需的大量計(jì)算操作可能會(huì)導(dǎo)致訓(xùn)練時(shí)間過長。

那這個(gè)參數(shù)已是GPT-3三倍的MT-NLG又是如何解決的呢?答案就是汲取“兩家”所長,融合英偉達(dá)最先進(jìn)的GPU加速訓(xùn)練設(shè)備,以及微軟最先進(jìn)的分布式學(xué)習(xí)系統(tǒng),來提高訓(xùn)練速度。并用上千億個(gè)token構(gòu)建語料庫,共同開發(fā)訓(xùn)練方法來優(yōu)化效率和穩(wěn)定性。

具體來說,通過借鑒英偉達(dá)Megatron-LM模型的GPU并行處理,以及微軟開源的分布式訓(xùn)練框架DeepSpeed,創(chuàng)建3D并行系統(tǒng)。對于本文中這個(gè)5300億個(gè)參數(shù)的模型,每個(gè)模型副本跨越280個(gè)NVIDIA A100 GPU,節(jié)點(diǎn)內(nèi)采用Megatron-LM的8路張量切片(tensor-slicing),節(jié)點(diǎn)間采用35路管道并行(pipeline parallelism)。

然后再使用DeepSpeed的數(shù)據(jù)并行性進(jìn)一步擴(kuò)展到數(shù)千個(gè)GPU。最終在基于NVIDIA DGX SuperPOD的Selene超級計(jì)算機(jī)上完成混合精度訓(xùn)練。(該超級計(jì)算機(jī)由560個(gè)DGX A100服務(wù)器提供支持,每個(gè)DGX A100有8個(gè) NVIDIA A100 80GB Tensor Core GPU,通過NVLink 和 NVSwitch相互完全連接)。

該模型使用了Transformer解碼器的架構(gòu),層數(shù)、hidden dimension和attention head分別為 105、20480和128。訓(xùn)練所用數(shù)據(jù)集包括近20萬本書的純文本數(shù)據(jù)集Books3、問答網(wǎng)站Stack Exchange、維基百科、學(xué)術(shù)資源網(wǎng)站PubMed Abstracts、ArXiv、維基百科、GitHub等等,這些都是從他們先前搭建的Pile數(shù)據(jù)集中挑出的質(zhì)量較高的子集。最終一共提取了2700億個(gè)token。

浪潮發(fā)布2500億參數(shù)的中文AI巨量模型“源1.0”

9月28日,浪潮人工智能研究院發(fā)布浪潮發(fā)布了2500億參數(shù)的中文AI巨量模型“源1.0”。

“源1.0”不僅有高達(dá)5TB的全球最大中文高質(zhì)量數(shù)據(jù)集,在總計(jì)算量和訓(xùn)練效率優(yōu)化上都是空前的。源1.0幾乎把近5年整個(gè)中文互聯(lián)網(wǎng)的浩瀚內(nèi)容全部讀完,在收集并清洗數(shù)據(jù)后,最終獲得5TB高質(zhì)量數(shù)據(jù),成為迄今業(yè)界最大的高質(zhì)量中文數(shù)據(jù)集。

在語言智能方面,源1.0獲得中文語言理解評測基準(zhǔn)CLUE榜單零樣本學(xué)習(xí)和小樣本學(xué)習(xí)兩類總榜冠軍,獲得小樣本學(xué)習(xí)的文獻(xiàn)分類、商品分類、文獻(xiàn)摘要識(shí)別、名詞代詞關(guān)系等4項(xiàng)任務(wù)冠軍。

“在數(shù)據(jù)量、參數(shù)規(guī)模與模型精度方面,源1.0均居全球之最。”浪潮人工智能研究院首席研究員吳韶華說。對標(biāo)OpenAI的GPT-3,源1.0參數(shù)規(guī)模為2457億,訓(xùn)練采用的中文數(shù)據(jù)集達(dá)5TB。相比GPT-3模型1750億參數(shù)量和570GB訓(xùn)練數(shù)據(jù)集,源1.0參數(shù)規(guī)模領(lǐng)先40%,訓(xùn)練數(shù)據(jù)集規(guī)模領(lǐng)先近10倍。

“得益于我們設(shè)計(jì)模型時(shí),對精度和計(jì)算性能的協(xié)同?!眳巧厝A說,“在算法上,我們解決了巨量模型訓(xùn)練不穩(wěn)定的業(yè)界難題,提出穩(wěn)定訓(xùn)練巨量模型的算法,打造了巨量模型推理方法創(chuàng)新;在數(shù)據(jù)方面,我們生成了迄今業(yè)界最大的高質(zhì)量中文數(shù)據(jù)集;在算力上,我們通過算法與算力協(xié)同優(yōu)化,極大提升了計(jì)算效率,在實(shí)現(xiàn)業(yè)界訓(xùn)練性能第一的同時(shí),還達(dá)到了業(yè)界領(lǐng)先的精度?!?br />
巨量模型是未來的發(fā)展方向

“認(rèn)知智能是人工智能研究者追求的方向之一?!敝袊こ淘涸菏客醵鳀|告訴《中國科學(xué)報(bào)》,“除了加速深度學(xué)習(xí)技術(shù),開發(fā)全新的算法范式研究方向外,大規(guī)模數(shù)據(jù)訓(xùn)練超大參數(shù)量的巨量模型也是未來發(fā)展方向,即利用先進(jìn)的算法,整合大規(guī)模的數(shù)據(jù),匯聚大量算力,訓(xùn)練出巨量人工智能模型?!?br />
2020年6月,OpenAI發(fā)布了參數(shù)量高達(dá)1750億的大模型GPT-3,該模型一推出就引起人工智能學(xué)界和業(yè)界的轟動(dòng)?!罢Z言模型是全球AI界的‘必爭之地’?!币晃蝗斯ぶ悄苎芯款I(lǐng)域的專家說,“參數(shù)規(guī)模大到遠(yuǎn)超我們想象的時(shí)候,會(huì)發(fā)生一些難以解釋的現(xiàn)象?!?br />
浪潮信息副總裁劉軍同樣認(rèn)為,生命從簡單進(jìn)化到復(fù)雜,這種智能水平本身就是一種模型。如果把模型比作元宇宙中的生命,大模型的這種綜合系統(tǒng)能力,可能會(huì)決定未來數(shù)字世界和智能世界里的智能水平。“人的神經(jīng)元突觸超過100萬億,而現(xiàn)有大模型的參數(shù)量還遠(yuǎn)遠(yuǎn)不夠,所以我們還有很遠(yuǎn)路要走”。

伴隨著人工智能應(yīng)用廣度與深度的不斷提升,眾多行業(yè)、諸多業(yè)務(wù)場景的智能化創(chuàng)新需求日益增多。然而當(dāng)前大多數(shù)AI模型只能用于某一特定領(lǐng)域,通用性不強(qiáng),這對AI技術(shù)提出了挑戰(zhàn),也限制了AI的產(chǎn)業(yè)化進(jìn)程。

大模型在今天初露崢嶸絕非偶然。技術(shù)、算力、資源、需求等多因素的“風(fēng)云際會(huì)”,讓被AI業(yè)界視為“核力量”的大模型嶄露頭角。

電子發(fā)燒友綜合報(bào)道,參考自量子位、浪潮服務(wù)器

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6750

    瀏覽量

    108061
  • 浪潮
    +關(guān)注

    關(guān)注

    1

    文章

    490

    瀏覽量

    25477
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4112

    瀏覽量

    99588
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    狂攬430凈利!英偉達(dá)Q4炸裂財(cái)報(bào):數(shù)據(jù)中心獨(dú)吞90%營收

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)近日,英偉達(dá)公布了截至 1 月 25 日的第四財(cái)季業(yè)績, 營收 681 美元, 上年同期為 393.31 美元,同比增長 73%; 凈利潤 同比大漲9
    的頭像 發(fā)表于 02-27 09:15 ?7045次閱讀
    狂攬430<b class='flag-5'>億</b>凈利!<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>Q4炸裂財(cái)報(bào):數(shù)據(jù)中心獨(dú)吞90%營收

    AI不是泡沫,是訂單!英偉達(dá)Q3業(yè)績超預(yù)期,數(shù)據(jù)中心營收超512美元

    GAAP)達(dá)317.67美元,同比增長59%,環(huán)比增長23%。營收和凈利潤雙雙超過華爾街預(yù)期。 ? ? 更令人關(guān)注的是,英偉達(dá)創(chuàng)始人兼CE
    的頭像 發(fā)表于 11-23 07:49 ?1.1w次閱讀
    AI不是泡沫,是訂單!<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>Q<b class='flag-5'>3</b>業(yè)績超預(yù)期,數(shù)據(jù)中心營收超512<b class='flag-5'>億</b>美元

    套現(xiàn)413!軟銀清倉英偉達(dá),AI硬件泡沫破裂?

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)前幾天,全球知名的科技投資公司日本軟銀集團(tuán)(SBG)突然宣布,公司已經(jīng)在今年10月出售了所持有的全部英偉達(dá)股票,共計(jì)3210萬股,套現(xiàn)58美元(約合人民幣413
    的頭像 發(fā)表于 11-13 09:19 ?6142次閱讀

    AI推理需求井噴!英偉達(dá)Q1營收大漲,H20禁售難擋增長步伐

    報(bào)告,在全球加大AI基礎(chǔ)設(shè)施的浪潮下,英偉達(dá)第一季度總體營收達(dá)到440.6美元,較去年同期增長69%,高于市場預(yù)期的431美元;凈利潤1
    的頭像 發(fā)表于 05-31 01:13 ?8370次閱讀
    AI推理需求井噴!<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>Q1營收大漲,H20禁售難擋增長步伐

    硅光成AI勝負(fù)手?英偉達(dá)20美元戰(zhàn)略投資Marvell

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)當(dāng)?shù)貢r(shí)間 3 月 31 日(周二),全球市值最高的半導(dǎo)體企業(yè)英偉達(dá)正式宣布,向美國半導(dǎo)體廠商邁威爾科技(Marvell,MRVL.US)戰(zhàn)略投資 20
    的頭像 發(fā)表于 04-06 07:02 ?1.1w次閱讀

    40美元!英偉達(dá)投資兩家光學(xué)公司,加碼AI算力生態(tài)

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,英偉達(dá)在其官網(wǎng)宣布,與Lumentum和Coherent兩家光學(xué)技術(shù)公司達(dá)成戰(zhàn)略協(xié)議,將分別向它們投資20美元。 ? 英偉
    的頭像 發(fā)表于 03-04 09:35 ?6143次閱讀

    如何在NVIDIA Jetson AGX Thor上部署1200參數(shù)模型

    我們將嘗試能否在 Jetson AGX Thor 上部署并成功運(yùn)行高達(dá) 1,200 參數(shù)量的 gpt-oss-120b 大模型。
    的頭像 發(fā)表于 12-26 17:06 ?5191次閱讀
    如何在NVIDIA Jetson AGX Thor上部署1200<b class='flag-5'>億</b><b class='flag-5'>參數(shù)</b>大<b class='flag-5'>模型</b>

    英偉達(dá) Q3 狂攬 308

    英偉達(dá) 2025 財(cái)年第三季度交出亮眼成績單,數(shù)據(jù)中心業(yè)務(wù)營收飆至 308 美元,同比增長 112%,占總銷售額的 88%。這一爆發(fā)式增長,核心源于全球 AI 算力需求激增,谷歌、微軟
    的頭像 發(fā)表于 11-20 18:11 ?1345次閱讀

    今日看點(diǎn):英偉達(dá)三季度營收達(dá)570美元,云 GPU 已售罄;蔚來智駕芯片被曝首次技術(shù)外供

    英偉達(dá)三季度營收達(dá)570美元,云 GPU 已售罄 英偉達(dá)2025年第三季度(截至2025年10
    發(fā)表于 11-20 10:52 ?1123次閱讀

    NVIDIA新聞:英偉達(dá)10美元入股諾基亞 英偉達(dá)推出全新量子設(shè)備

    給大家分享一些NVIDIA新聞: 英偉達(dá)10美元入股諾基亞 在當(dāng)?shù)貢r(shí)間10月28日,英偉達(dá)正式宣布將以10
    的頭像 發(fā)表于 10-29 17:12 ?2357次閱讀

    今日看點(diǎn):蘋果認(rèn)證中國快充品牌遭美調(diào)查;英偉達(dá)擬向OpenAI投資最高1000美元

    英偉達(dá)擬向OpenAI投資最高1000美元 近日,英偉達(dá)和OpenAI宣布達(dá)成合作,包括建設(shè)龐大數(shù)據(jù)中心計(jì)劃,以及
    發(fā)表于 09-23 10:09 ?499次閱讀

    英偉達(dá)斥資50美元入股英特爾,芯片巨頭攜手重塑行業(yè)格局

    在科技行業(yè)引發(fā)廣泛關(guān)注的重大事件中,當(dāng)?shù)貢r(shí)間9月18日,全球知名的芯片企業(yè)英偉達(dá)宣布,將斥資50美元入股英特爾,雙方還達(dá)成合作協(xié)議,共同致力于人工智能基礎(chǔ)設(shè)施和個(gè)人計(jì)算產(chǎn)品的聯(lián)合開發(fā)。這一消息猶如
    的頭像 發(fā)表于 09-22 17:35 ?970次閱讀

    看點(diǎn):臺(tái)積電6月銷售額2637.1元新臺(tái)幣 英偉達(dá)市值相當(dāng)于日本全年GDP 微軟大裁員背后:靠AI節(jié)省5美元

    累計(jì)銷售額1.77萬億元新臺(tái)幣,同比增長40% 英偉達(dá)市值相當(dāng)于日本全年GDP 英偉達(dá)股價(jià)盤中一度漲超2.5%;報(bào)164美元/股,總市值超4萬億美元,該市值再一次創(chuàng)造歷史!
    的頭像 發(fā)表于 07-10 17:57 ?1023次閱讀
    看點(diǎn):臺(tái)積電6月銷售額2637.1<b class='flag-5'>億</b>元新臺(tái)幣 <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>市值相當(dāng)于日本全年GDP <b class='flag-5'>微軟</b>大裁員背后:靠AI節(jié)省5<b class='flag-5'>億</b>美元

    英偉達(dá)2026財(cái)年Q1營收公布 一季度營收441美元 英偉達(dá)Q1凈利潤187.8美元

    英偉達(dá)的業(yè)績暴漲神話依然在繼續(xù),在5月29日英偉達(dá)公司發(fā)布了2026財(cái)年第一季度財(cái)報(bào)。財(cái)報(bào)數(shù)據(jù)顯示,該季度
    的頭像 發(fā)表于 05-29 17:58 ?1250次閱讀

    華為助力中國石油發(fā)布3000參數(shù)昆侖大模型

    5月28日,中國石油發(fā)布3000參數(shù)昆侖大模型,標(biāo)志著中國石油在人工智能領(lǐng)域又邁出關(guān)鍵一步,全力推動(dòng)“人工智能+”行動(dòng)走深走實(shí)。 ? 中國石油發(fā)布
    的頭像 發(fā)表于 05-29 09:19 ?1189次閱讀
    華為助力中國石油<b class='flag-5'>發(fā)布</b>3000<b class='flag-5'>億</b><b class='flag-5'>參數(shù)</b>昆侖大<b class='flag-5'>模型</b>
    宝坻区| 尤溪县| 江城| 琼中| 长乐市| 神木县| 芜湖市| 德格县| 普兰县| 营口市| 海盐县| 安徽省| 慈利县| 凤冈县| 岳池县| 日喀则市| 高碑店市| 和林格尔县| 盖州市| 北安市| 克山县| 扎鲁特旗| 海宁市| 太仓市| 明水县| 柳河县| 舟山市| 杭锦后旗| 东丰县| 彰化县| 黎平县| 民权县| 长海县| 时尚| 玉溪市| 会同县| 上杭县| 迁西县| 富宁县| 民权县| 长海县|