哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

軟件生態(tài)上超越CUDA,究竟有多難?

E4Life ? 來(lái)源:電子發(fā)燒友 ? 作者:周凱揚(yáng) ? 2024-06-20 00:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))近日,英偉達(dá)憑借持續(xù)上漲的股價(jià),正式超過(guò)了微軟成為全球市值最高的公司,這固然離不開GPU這一AI硬件的火熱,但之所以能一舉做到世界第一,也離不開軟件的加持,真正將其推向神壇的,還是圍繞CUDA打造的一系列軟件生態(tài)。

英偉達(dá)——CUDA的絕對(duì)統(tǒng)治

相信對(duì)GPU有過(guò)一定了解的都知道,英偉達(dá)的最大護(hù)城河就是CUDA。CUDA在后端架構(gòu)上處于絕對(duì)的統(tǒng)治地位,隨著AI發(fā)展越快,英偉達(dá)GPU+CUDA的開發(fā)生態(tài)發(fā)展愈發(fā)壯大,甚至到了很多競(jìng)爭(zhēng)對(duì)手望其項(xiàng)背的水平。CUDA自2006年推出以來(lái),即便在AI和深度學(xué)習(xí)沒(méi)有成為主流的時(shí)期,也在不斷發(fā)展并行計(jì)算,為開發(fā)者提供豐富的庫(kù)、工具和算法

時(shí)至今日,CUDA已經(jīng)為全球開發(fā)者打造了一個(gè)龐大的社區(qū),幾乎所有的深度學(xué)習(xí)框架,包括TensorFlow、Pytorch等都對(duì)CUDA做了優(yōu)化。為了盡快切入市場(chǎng),絕大多數(shù)開發(fā)者都更傾向于選擇CUDA作為首要計(jì)算平臺(tái)。

與此同時(shí),英偉達(dá)也在圍繞著CUDA在硬件架構(gòu)上做更深入的創(chuàng)新和升級(jí),借助更先進(jìn)的工藝和封裝技術(shù)提升計(jì)算性能和效率。比如隨著Volta架構(gòu)中引入Tensor核心后,英偉達(dá)GPU的矩陣運(yùn)算得到大幅加強(qiáng),深度學(xué)習(xí)訓(xùn)練和推理的性能實(shí)現(xiàn)飛躍。兩者結(jié)合之下,使得CUDA坐穩(wěn)了第一的寶座。

在游戲軟件領(lǐng)域,英偉達(dá)的DLSS可以說(shuō)是市面上最先進(jìn)的專有超分技術(shù),且得益于持續(xù)的訓(xùn)練,每一次版本升級(jí)都能帶來(lái)圖形渲染領(lǐng)域的突破。

最后是生產(chǎn)力工具相關(guān)的軟件生態(tài)上,英偉達(dá)在這塊的優(yōu)勢(shì)就更加足了,過(guò)去蘋果與AMD還在GPU上合作之際,不少生產(chǎn)力工具還是針對(duì)AMD的GPU做了不少硬件優(yōu)化的。然而隨著蘋果走向Arm架構(gòu),英偉達(dá)慢慢在這個(gè)市場(chǎng)壯大起來(lái)。

無(wú)論是Adobe旗下的多媒體處理軟件,還是一些獨(dú)立開發(fā)商打造的軟件,很多都有英偉達(dá)CUDA硬件加速的支持,甚至連英特爾的核顯在一些軟件支持上,都要好于AMD。正因如此,除了一些特效制作相關(guān)的工作外,工作站里的AMD GPU越來(lái)越少。

盡管谷歌、英特爾和高通等科技巨頭也在尋找打破CUDA壟斷地位的契機(jī),但對(duì)于軟件生態(tài)而言,合作并不一定意味著共贏,最后很可能只是為市場(chǎng)提供更多的可選擇項(xiàng),但在易用性、性能等方面,仍不如沒(méi)有駐足一路狂奔的CUDA。

AMD

AMD對(duì)于其GPU軟件生態(tài)則持以較為開放的態(tài)度,且極其重視開源開發(fā)社區(qū)。AMD的ROCm對(duì)標(biāo)的正是英偉達(dá)的CUDA,但其并沒(méi)有對(duì)硬件做出限制,除了Radeon、Instinct系列的GPU外,也在擴(kuò)展至其他硬件廠商的設(shè)備。這也得益于AMD沒(méi)有在硬件內(nèi)引入Tensor核心這樣的專有硬件,但也正是因?yàn)槿绱?,?dǎo)致其ROCm在某些任務(wù)上略顯遜色。

ROCm作為開源平臺(tái),也提供多種庫(kù)和框架支持,也有一整套的開源工具鏈。正因如此,在HPC和云計(jì)算等領(lǐng)域,廠商其實(shí)更寧愿使用AMD的GPU,而不必要忍受英偉達(dá)的專用軟件棧。但苦于英偉達(dá)先行的軟件生態(tài),他們不得不首選英偉達(dá)的GPU。

AMD即便有了ROCm,整體軟件生態(tài)的成熟度依然不敵英偉達(dá),對(duì)于HPC中部分不以商業(yè)成功為目標(biāo)的項(xiàng)目而言,AMD已經(jīng)斬獲了不少份額,比如TOP500中前十的幾臺(tái)超算。但以整個(gè)TOP500榜單來(lái)看,英偉達(dá)依然占據(jù)主導(dǎo)地位。然而對(duì)于云供應(yīng)商來(lái)說(shuō),短時(shí)間內(nèi)依然沒(méi)法擺脫英偉達(dá)的統(tǒng)治,因?yàn)樽庥眠@些云服務(wù)的客戶們,更愿意在英偉達(dá)的CUDA平臺(tái)上開發(fā)。

在驅(qū)動(dòng)軟件上,尤其是針對(duì)Linux的顯卡驅(qū)動(dòng),AMD采取了開源和閉源兩條路線,持續(xù)更新閉源驅(qū)動(dòng)的同時(shí),也允許開源社區(qū)定制化開源驅(qū)動(dòng)。以基于Linux系統(tǒng)中AMD Radeon顯卡打造的Vulkan驅(qū)動(dòng)AMDVLK為例,就支持了光線追蹤。然而,盡管開源驅(qū)動(dòng)由于手動(dòng)配置和社區(qū)貢獻(xiàn)的原因,兼容性要更高一些,但如果追求的是更高的性能,那么閉源驅(qū)動(dòng)還是更具優(yōu)勢(shì)。

摩爾線程

國(guó)產(chǎn)GPU主要分為兩個(gè)方向,分別是支持圖形渲染的和不支持圖形渲染的,后者仍然想在AI領(lǐng)域內(nèi)突破,前者在推進(jìn)C端產(chǎn)品的同時(shí),也在布局B端的一系列AI GPU產(chǎn)品。在國(guó)產(chǎn)GPU產(chǎn)品中,在軟件生態(tài)上做得比較好的當(dāng)屬摩爾線程了,他們?cè)贏I和圖形渲染上的軟件支持都有喜人的進(jìn)展。

基于MUSA這一統(tǒng)一架構(gòu),摩爾線程打造了MTT S80這樣的桌面顯卡,以及面面向服務(wù)器應(yīng)用的MTT S3000等。與之配套的,是摩爾線程打造的軟件開發(fā)平臺(tái),包括AI開發(fā)平臺(tái)、MUSA SDK、MT Smart Media和MTVerse XR等。

而且摩爾線程打造的這套生態(tài)架構(gòu)中,可以充分兼容現(xiàn)有軟件生態(tài),借助MUSIFY工具實(shí)現(xiàn)代碼零成本遷移到MUSA平臺(tái)。與AMD的ROCm一樣,MUSA做的也是兼容CUDA的路線,而不是像ZLUDA一樣重新編譯二進(jìn)制代碼,所以并不違反英偉達(dá)的EULA條款。

從摩爾線程近來(lái)官方發(fā)布的消息看來(lái),他們?cè)贏I上選擇了逐步對(duì)大模型完成適配支持的路線。在摩爾線程的夸娥千卡智算集群上,他們已經(jīng)完成了30億到700億參數(shù)的大模型訓(xùn)練和推理適配。摩爾線程的GPU在算力上對(duì)比國(guó)際大廠還是略有遜色,不過(guò)隨著未來(lái)他們?cè)贗P、硬件設(shè)計(jì)上進(jìn)一步突破,相信他們也能打造出高性能的AI算力底座。

在針對(duì)消費(fèi)級(jí)圖形顯卡的驅(qū)動(dòng)程序上,摩爾線程也在不斷更新優(yōu)化性能。以5月底發(fā)布的v260.70版本驅(qū)動(dòng)為例,除了提供對(duì)OpenGL 4.0功能的支持和優(yōu)化Blender 3.6 LTS體驗(yàn)外,也為諸多熱門游戲在DirectX 11下的性能做了明顯優(yōu)化。盡管這類驅(qū)動(dòng)更新的規(guī)模比起英偉達(dá)還有所差距,但也代表了廠商持續(xù)優(yōu)化性能表現(xiàn)的決心。

寫在最后

其實(shí)從越來(lái)越多的廠商進(jìn)軍GPU,越來(lái)越多的GPU廠商發(fā)力AI就可以看出,即便CUDA有著深厚的生態(tài)積累,但在日新月異的AI中,其他廠商仍有分一杯羹的機(jī)會(huì),甚至可能在某個(gè)應(yīng)用中后來(lái)者居上。但在圖形渲染相關(guān)的軟件生態(tài)上,廠商面臨的技術(shù)壁壘更加厚。不僅要帶著鉆研十?dāng)?shù)年的決心,還要持續(xù)打磨硬件產(chǎn)品,與產(chǎn)業(yè)軟件生態(tài)圈合作,挖掘和培養(yǎng)更多的圖形研究人才。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5266

    瀏覽量

    136040
  • CUDA
    +關(guān)注

    關(guān)注

    0

    文章

    128

    瀏覽量

    14545
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4113

    瀏覽量

    99598
  • 軟件生態(tài)系統(tǒng)

    關(guān)注

    0

    文章

    9

    瀏覽量

    7211
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    RV生態(tài)又一里程碑:英偉達(dá)官宣CUDA將兼容RISC-V架構(gòu)!

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)英偉達(dá)生態(tài)護(hù)城河CUDA,從最初支持x86、Power?CPU架構(gòu),到2019年宣布支持Arm?CPU,不斷拓展在數(shù)據(jù)中心的應(yīng)用生態(tài)。 在2019年至今的六年
    的頭像 發(fā)表于 07-19 00:04 ?6793次閱讀
    RV<b class='flag-5'>生態(tài)</b>又一里程碑:英偉達(dá)官宣<b class='flag-5'>CUDA</b>將兼容RISC-V架構(gòu)!

    借助NVIDIA CUDA Tile IR后端推進(jìn)OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計(jì)目標(biāo)是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU 的極限性能。CUDA Tile 的一大優(yōu)勢(shì)是允許開發(fā)者基于其構(gòu)建自定義的 DSL。
    的頭像 發(fā)表于 02-10 10:31 ?503次閱讀

    聲智科技亮相2026瑞芯微AI軟件生態(tài)大會(huì)

    近日,瑞芯微 AI 軟件生態(tài)大會(huì)在福州召開,這場(chǎng)大會(huì)匯聚了各行各業(yè)逾500位AI軟件生態(tài)伙伴,包括業(yè)內(nèi)主流的基座模型伙伴、頭部AI軟件/算法
    的頭像 發(fā)表于 02-01 10:25 ?655次閱讀

    如何在NVIDIA CUDA Tile中編寫高性能矩陣乘法

    本博文是系列課程的一部分,旨在幫助開發(fā)者學(xué)習(xí) NVIDIA CUDA Tile 編程,掌握構(gòu)建高性能 GPU 內(nèi)核的方法,并以矩陣乘法作為核心示例。
    的頭像 發(fā)表于 01-22 16:43 ?5263次閱讀
    如何在NVIDIA <b class='flag-5'>CUDA</b> Tile中編寫高性能矩陣乘法

    NVIDIA CUDA Tile的創(chuàng)新之處、工作原理以及使用方法

    NVIDIA CUDA 13.1 推出 NVIDIA CUDA Tile,這是自 2006 年 NVIDIA CUDA 平臺(tái)發(fā)明以來(lái),最大的一次技術(shù)進(jìn)步。這一令人振奮的創(chuàng)新引入了一套面向
    的頭像 發(fā)表于 12-24 10:17 ?625次閱讀
    NVIDIA <b class='flag-5'>CUDA</b> Tile的創(chuàng)新之處、工作原理以及使用方法

    在Python中借助NVIDIA CUDA Tile簡(jiǎn)化GPU編程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來(lái) GPU 編程最核心的更新之一。借助 GPU tile kernels,可以用比 SIMT
    的頭像 發(fā)表于 12-13 10:12 ?1392次閱讀
    在Python中借助NVIDIA <b class='flag-5'>CUDA</b> Tile簡(jiǎn)化GPU編程

    NVIDIA CUDA 13.1版本的新增功能與改進(jìn)

    NVIDIA CUDA 13.1 是自 CUDA 二十年前發(fā)明以來(lái),規(guī)模最大、內(nèi)容最全面的一次更新。
    的頭像 發(fā)表于 12-13 10:08 ?2432次閱讀

    首款全國(guó)產(chǎn)訓(xùn)推一體AI芯片發(fā)布,兼容CUDA生態(tài)

    CUDA生態(tài)體系。該芯片支持從單機(jī)多卡到千卡級(jí)集群的靈活擴(kuò)展,能效比達(dá)3.41 TFLOPS/W——在同等功
    的頭像 發(fā)表于 11-30 07:20 ?9736次閱讀
    首款全國(guó)產(chǎn)訓(xùn)推一體AI芯片發(fā)布,兼容<b class='flag-5'>CUDA</b><b class='flag-5'>生態(tài)</b>

    弱電智能化中究竟有多少個(gè)子系統(tǒng)?

    子系統(tǒng),每個(gè)子系統(tǒng)都承擔(dān)著特定的功能,共同為建筑提供全面的智能化服務(wù)。隨著技術(shù)的不斷進(jìn)步,弱電智能化系統(tǒng)的子系統(tǒng)也在不斷發(fā)展和完善。那么,弱電智能化中究竟有多少個(gè)子系統(tǒng)呢?本文將詳細(xì)列舉并介紹這些子系統(tǒng)。 一
    的頭像 發(fā)表于 11-24 09:57 ?1424次閱讀
    弱電智能化中<b class='flag-5'>究竟有</b>多少個(gè)子系統(tǒng)?

    中科芯亮相2025智能汽車基礎(chǔ)軟件生態(tài)大會(huì)

    此前,8月28日—29日,2025智能汽車基礎(chǔ)軟件生態(tài)大會(huì)暨第四屆中國(guó)汽車芯片大會(huì)在重慶召開。作為2025世界智能產(chǎn)業(yè)博覽會(huì)系列活動(dòng),大會(huì)以“開源拓界 眾行致遠(yuǎn)”為主題,來(lái)自政、產(chǎn)、學(xué)、研、用等領(lǐng)域的500多位專家、學(xué)者和企業(yè)代表共同探討開源共建模式的深化應(yīng)用、
    的頭像 發(fā)表于 09-29 11:01 ?1139次閱讀

    AUTOSAR亮相2025智能汽車基礎(chǔ)軟件生態(tài)大會(huì)

    此前,8月28日—29日,2025智能汽車基礎(chǔ)軟件生態(tài)大會(huì)暨第四屆中國(guó)汽車芯片大會(huì)在重慶召開。作為2025世界智能產(chǎn)業(yè)博覽會(huì)系列活動(dòng),大會(huì)以“開源拓界 眾行致遠(yuǎn)”為主題,來(lái)自政、產(chǎn)、學(xué)、研、用等領(lǐng)域的500多位專家、學(xué)者和企業(yè)代表共同探討開源共建模式的深化應(yīng)用、
    的頭像 發(fā)表于 09-22 14:33 ?1090次閱讀

    潤(rùn)和軟件及潤(rùn)開鴻出席鴻蒙生態(tài)大會(huì)2025

    )理事單位及鴻蒙生態(tài)核心伙伴,江蘇潤(rùn)和軟件股份有限公司(以下簡(jiǎn)稱“潤(rùn)和軟件”)及旗下子公司江蘇潤(rùn)開鴻數(shù)字科技有限公司(以下簡(jiǎn)稱“潤(rùn)開鴻”)共同出席大會(huì),參與見證多項(xiàng)重磅標(biāo)準(zhǔn)發(fā)布,并通過(guò)行業(yè)議題分享、創(chuàng)新場(chǎng)景成果展示等呈現(xiàn)了自身面
    的頭像 發(fā)表于 09-06 19:14 ?2905次閱讀

    普華基礎(chǔ)軟件亮相2025智能汽車基礎(chǔ)軟件生態(tài)大會(huì)

    8月28日—29日,2025智能汽車基礎(chǔ)軟件生態(tài)大會(huì)暨第四屆中國(guó)汽車芯片大會(huì)在重慶渝州賓館盛大召開。29日上午舉辦的2025智能汽車基礎(chǔ)軟件生態(tài)大會(huì)上,來(lái)自政、產(chǎn)、學(xué)、研、用等領(lǐng)域的5
    的頭像 發(fā)表于 09-03 16:43 ?1547次閱讀

    Microsoft AD究竟有多重要

    勒索軟件攻防已成一場(chǎng)永無(wú)止境的貓鼠游戲——在IT和安全團(tuán)隊(duì)不斷提升能力的同時(shí),攻擊者也在不斷尋找新的攻擊路徑,而AD作為集中管理的核心要素,已成為勒索軟件攻擊的主要目標(biāo)和執(zhí)行路徑。
    的頭像 發(fā)表于 07-22 13:57 ?860次閱讀

    FOC電機(jī)控制究竟該如何學(xué)?

    學(xué)習(xí)FOC電機(jī)控制究竟是學(xué)哪些內(nèi)容? 電機(jī)知識(shí) 軟件知識(shí) 純分享貼,有需要可以直接下載附件獲取完整資料! (如果內(nèi)容有幫助可以關(guān)注、點(diǎn)贊、評(píng)論支持一下哦~)
    發(fā)表于 05-09 14:09
    邯郸县| 循化| 万全县| 桂阳县| 舞钢市| 镇平县| 金坛市| 庄河市| 临泽县| 绥阳县| 新干县| 鸡西市| 南投县| 隆昌县| 平邑县| 姜堰市| 丹东市| 庄浪县| 民县| 抚远县| 城步| 那坡县| 赣榆县| 南木林县| 茶陵县| 龙泉市| 甘德县| 衡南县| 涞水县| 兴安县| 偏关县| 西峡县| 乌什县| 呼玛县| 忻城县| 湾仔区| 东阳市| 巫溪县| 西藏| 嘉兴市| 南宁市|