哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國(guó)產(chǎn)AI算力:從DeepSeek V4與華為昇騰協(xié)同看全棧自主之路

Carol Li ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2026-04-25 07:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)2026年4月24日,DeepSeek V4 - Pro和DeepSeek V4 - Flash正式發(fā)布并開(kāi)源。模型上下文處理長(zhǎng)度從128K大幅提升至1M,新增KV Cache滑窗和壓縮算法,顯著降低計(jì)算與訪(fǎng)存開(kāi)銷(xiāo),在A(yíng)gent能力、世界知識(shí)和推理性能上處于國(guó)內(nèi)及開(kāi)源領(lǐng)域領(lǐng)先地位。

與此同時(shí),華為宣布昇騰超節(jié)點(diǎn)全系列產(chǎn)品全面支持DeepSeek V4系列,這場(chǎng)芯模協(xié)同不僅彰顯技術(shù)實(shí)力,更標(biāo)志著國(guó)產(chǎn)AI算力在擺脫海外依賴(lài)、構(gòu)建全棧自主生態(tài)上邁出關(guān)鍵一步。

生態(tài)遷移:從CUDA到CANN的跨越

DeepSeek V4與華為昇騰的合作,核心在于從英偉達(dá)CUDA生態(tài)向華為自研的CANN異構(gòu)計(jì)算架構(gòu)遷移,這一過(guò)程遠(yuǎn)非簡(jiǎn)單的代碼移植。

過(guò)去,中國(guó)大模型開(kāi)發(fā)高度依賴(lài)英偉達(dá)GPU和CUDA生態(tài),從訓(xùn)練到推理都面臨卡脖子風(fēng)險(xiǎn)。此次遷移需重寫(xiě)數(shù)十萬(wàn)行底層代碼,重構(gòu)通信協(xié)議、顯存管理等核心模塊,攻克算子對(duì)齊、通信優(yōu)化、內(nèi)存管理三大技術(shù)壁壘。

據(jù)傳,DeepSeek團(tuán)隊(duì)耗時(shí)14個(gè)月攻堅(jiān),華為工程師駐場(chǎng)支持,反復(fù)調(diào)試精度、優(yōu)化算子。最終,經(jīng)深度優(yōu)化,DeepSeek V4在昇騰950PR上的推理速度較初期版本提升35倍,能耗降低40%。第三方評(píng)測(cè)顯示,昇騰950PR單卡推理性能達(dá)到英偉達(dá)特供版H20芯片的2.87倍。這一成果表明國(guó)產(chǎn)AI芯片正加速?gòu)摹翱捎谩边~向“好用”,在特定場(chǎng)景下已具備超越國(guó)際主流產(chǎn)品的競(jìng)爭(zhēng)力。

華為計(jì)算官微顯示,華為昇騰950超節(jié)點(diǎn)通過(guò)融合kernel和多流并行技術(shù),結(jié)合多種量化算法,實(shí)現(xiàn)了DeepSeek V4模型的高吞吐、低時(shí)延推理部署。具體而言,昇騰950超節(jié)點(diǎn)實(shí)現(xiàn)了DeepSeek V4 - Pro 20ms和DeepSeek V4 - Flash 10ms的極低時(shí)延推理。在8K輸入場(chǎng)景下,單卡Decode吞吐分別可達(dá)4700TPS(V4 - Pro)和1600TPS(V4 - Flash)。這一成就得益于昇騰950底層架構(gòu)的三大升級(jí):原生精度加速支持FP8、MXFP8等數(shù)據(jù)格式,內(nèi)存占用降低50%以上;稀疏訪(fǎng)存優(yōu)化解決MoE模型帶寬瓶頸;Vector與Cube共享Memory設(shè)計(jì)消除數(shù)據(jù)搬運(yùn)開(kāi)銷(xiāo)。

此外,Atlas 900 A3 SuperPoD液冷超節(jié)點(diǎn)及Atlas 800 A3風(fēng)冷超節(jié)點(diǎn)采用平等架構(gòu)、全局內(nèi)存統(tǒng)一編址、點(diǎn)對(duì)點(diǎn)互聯(lián)帶寬達(dá)784GB/s。提供32到384多種規(guī)格滿(mǎn)足不同業(yè)務(wù)需求,昇騰超節(jié)點(diǎn)是國(guó)內(nèi)唯一成熟規(guī)模商用的超節(jié)點(diǎn)產(chǎn)品,滿(mǎn)足互聯(lián)網(wǎng)、運(yùn)營(yíng)商、金融等行業(yè)對(duì)大模型推理超高吞吐、超大并發(fā)的極致性能需求。

基于昇騰A3 64卡超節(jié)點(diǎn)結(jié)合大EP模式部署,DeepSeek V4-Flash模型,8K/1K輸入輸出場(chǎng)景,基于vLLM推理引擎可實(shí)現(xiàn)2000+TPS的單卡Decode吞吐,單卡吞吐持續(xù)提升。針對(duì)DeepSeek V4-Pro模型,昇騰A3同步支持推理部署,性能持續(xù)優(yōu)化中。

此次合作意義重大,徹底打破了國(guó)產(chǎn)AI對(duì)海外技術(shù)的依賴(lài)。DeepSeek V4成為首個(gè)在華為昇騰平臺(tái)上完成從訓(xùn)練到推理完整閉環(huán)的萬(wàn)億級(jí)模型,中國(guó)首次擁有了從頂級(jí)大模型到自主算力基礎(chǔ)設(shè)施的完整、可控的AI技術(shù)棧。這不僅是技術(shù)上的勝利,更是產(chǎn)業(yè)生態(tài)的轉(zhuǎn)折點(diǎn),向市場(chǎng)證明國(guó)產(chǎn)算力有能力承載全球頂尖AI模型,且能實(shí)現(xiàn)性能與成本的雙重優(yōu)勢(shì)。

國(guó)產(chǎn)大模型與算力的協(xié)同共進(jìn)

在DeepSeek V4發(fā)布當(dāng)天,寒武紀(jì)宣布基于自研NeuWare軟件生態(tài)與vLLM框架,完成對(duì)DeepSeek V4的“Day 0”適配,并將適配代碼開(kāi)源至GitHub社區(qū)。這是寒武紀(jì)連續(xù)第二次在DeepSeek新模型發(fā)布首日推出國(guó)產(chǎn)芯片適配方案,通過(guò)自研高性能融合算子庫(kù)Torch - MLU - Ops和BangC編程語(yǔ)言,充分釋放硬件底層潛力。

天數(shù)智芯也完成了與DeepSeek - V4的Day 0級(jí)適配,以天垓系列訓(xùn)練芯片與智鎧系列推理芯片為核心,承接DeepSeek - V4的全場(chǎng)景應(yīng)用。此外,DeepSeek V4 - Flash還已經(jīng)在海光信息、沐曦、摩爾線(xiàn)程(FP8)、昆侖芯、平頭哥真武等國(guó)產(chǎn)AI芯片平臺(tái)上實(shí)現(xiàn)適配。

近年來(lái),隨著先進(jìn)大模型的發(fā)布和開(kāi)源,國(guó)產(chǎn)AI芯片廠(chǎng)商紛紛發(fā)布Day 0適配消息。如MiniMax M2.7全球開(kāi)源時(shí),華為昇騰、摩爾線(xiàn)程、沐曦股份、昆侖芯等廠(chǎng)商就宣布推理平臺(tái)已完成Day0適配,即在開(kāi)源首日完成模型接入與推理適配工作。

MiniMax M2.7開(kāi)源當(dāng)日,華為昇騰AI基礎(chǔ)軟硬件實(shí)現(xiàn)首日適配,基于vllm - Ascend推理引擎在A(yíng)tlas800A3、Atlas800IA2系列產(chǎn)品上為模型推理部署提供全流程支持;摩爾線(xiàn)程技術(shù)團(tuán)隊(duì)基于MUSA架構(gòu),針對(duì)M2.7的模型特點(diǎn)完成深度調(diào)優(yōu),成功在MTTS5000上實(shí)現(xiàn)模型高性能推理;沐曦曦云C系列GPU憑借全棧自研的MXMACA軟件棧,首日完成深度適配,實(shí)現(xiàn)“模型發(fā)布即算力就緒”的Day0體驗(yàn);昆侖芯依托自研架構(gòu),通過(guò)底層算子優(yōu)化與軟硬件協(xié)同加速,保障M2.7在平臺(tái)上的穩(wěn)定、高效運(yùn)行。

此外,近日騰訊混元Hy3preview語(yǔ)言模型發(fā)布并開(kāi)源,依托全棧自研技術(shù)優(yōu)勢(shì),壁仞科技基于vLLM主流開(kāi)源框架實(shí)現(xiàn)Hy3preview模型的Day0適配及推理驗(yàn)證。月內(nèi)該公司旗艦GPU產(chǎn)品適配國(guó)內(nèi)多家大模型,包括月之暗面Kimi K2.6模型、阿里(BABA)Qwen3.6-35B-A3B大模型等。

在A(yíng)I大模型和芯片領(lǐng)域,適配是關(guān)鍵技術(shù)術(shù)語(yǔ),指讓軟件在特定硬件或軟件平臺(tái)上順利、高效運(yùn)行的一整套技術(shù)工作。國(guó)產(chǎn)AI芯片在支持大模型推理上已呈現(xiàn)全面發(fā)展態(tài)勢(shì),此次華為昇騰對(duì)DeepSeek V4的全面支持,讓DeepSeek V4擺脫CUDA生態(tài)依賴(lài),使用CANN,國(guó)產(chǎn)AI算力實(shí)力更上一層樓。

國(guó)產(chǎn)AI算力的未來(lái)展望

DeepSeek V4與華為昇騰的深度融合,不僅是技術(shù)上的成功適配,更是深刻的戰(zhàn)略轉(zhuǎn)型,標(biāo)志著中國(guó)AI產(chǎn)業(yè)從依賴(lài)海外技術(shù)邁向全鏈路自主可控。

性能上的反超和成本上的巨大優(yōu)勢(shì),為國(guó)產(chǎn)AI的商業(yè)化落地鋪平道路。隨著下半年昇騰950超節(jié)點(diǎn)的批量上市,DeepSeek V4 - Pro的服務(wù)價(jià)格有望大幅下調(diào),這將加速AI技術(shù)在金融、政務(wù)、法律等關(guān)鍵領(lǐng)域的普及應(yīng)用。

從數(shù)據(jù)上來(lái)看,全球智能計(jì)算芯片市場(chǎng)預(yù)計(jì)2029年達(dá)到5857億美元,2024-2029年年符合增長(zhǎng)率37.5%;中國(guó)市場(chǎng)增長(zhǎng)更快,復(fù)合增長(zhǎng)率達(dá)46.3%,國(guó)產(chǎn)AI芯片廠(chǎng)商市場(chǎng)份額有望持續(xù)提升。

展望未來(lái),一個(gè)由國(guó)產(chǎn)芯片、國(guó)產(chǎn)框架、國(guó)產(chǎn)大模型構(gòu)成的完整AI生態(tài)閉環(huán)正在加速形成。這不僅體現(xiàn)了國(guó)家科技自立自強(qiáng)的戰(zhàn)略要求,也為全球AI產(chǎn)業(yè)發(fā)展提供了新的思路和模式。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI算力
    +關(guān)注

    關(guān)注

    1

    文章

    169

    瀏覽量

    10033
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    DeepSeek V3.1發(fā)布!擁抱國(guó)產(chǎn)芯片

    架構(gòu)到Agent能力突破,API價(jià)格調(diào)整到國(guó)產(chǎn)芯片生態(tài)共建,DeepSeek V3.1的發(fā)布標(biāo)志著中國(guó)AI產(chǎn)業(yè)進(jìn)入技術(shù)突破與產(chǎn)業(yè)落地
    的頭像 發(fā)表于 08-23 07:55 ?1.8w次閱讀
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>V</b>3.1發(fā)布!擁抱<b class='flag-5'>國(guó)產(chǎn)</b><b class='flag-5'>算</b><b class='flag-5'>力</b>芯片

    長(zhǎng)江計(jì)算G940K V2超節(jié)點(diǎn)服務(wù)器完成對(duì)DeepSeek V4模型極速適配

      4月24日,備受行業(yè)關(guān)注的大模型產(chǎn)品DeepSeek V4正式發(fā)布。烽火通信旗下長(zhǎng)江計(jì)算憑借深厚的技術(shù)積累與前瞻布局,以G940K V2超節(jié)點(diǎn)服務(wù)器為核心載體,同步完成對(duì)
    的頭像 發(fā)表于 04-24 17:40 ?988次閱讀

    端側(cè)AI爆發(fā)!斯貝達(dá)自研技術(shù),助力國(guó)產(chǎn)AI崛起

    江接受采訪(fǎng),分享了國(guó)產(chǎn)AI布局和產(chǎn)品市場(chǎng)拓展等話(huà)題。 ?
    的頭像 發(fā)表于 04-14 16:51 ?5123次閱讀

    【硬核發(fā)布】310B盒上新賦能2026集創(chuàng)賽華強(qiáng)x賽道玩轉(zhuǎn)新創(chuàng)意!

    -TECHNOLOGICALPROGRESS-310BAIBOX上新全場(chǎng)景AI高能效
    的頭像 發(fā)表于 03-27 17:12 ?1174次閱讀
    【硬核發(fā)布】<b class='flag-5'>昇</b><b class='flag-5'>騰</b>310B<b class='flag-5'>算</b><b class='flag-5'>力</b>盒上新賦能2026集創(chuàng)賽華強(qiáng)x<b class='flag-5'>昇</b><b class='flag-5'>騰</b>賽道玩轉(zhuǎn)新創(chuàng)意!

    國(guó)產(chǎn)出海元年開(kāi)啟

    ? 國(guó)產(chǎn)開(kāi)啟“大航海”時(shí)代。 黃仁勛前段時(shí)間訪(fǎng)華時(shí)曾表示:“華為AI芯片取代英偉達(dá)只是時(shí)間問(wèn)題。”彼時(shí),這話(huà)多被解讀為對(duì)老對(duì)手的客套。但
    的頭像 發(fā)表于 03-24 15:15 ?510次閱讀
    <b class='flag-5'>國(guó)產(chǎn)</b><b class='flag-5'>算</b><b class='flag-5'>力</b>出海元年開(kāi)啟

    華為發(fā)布全新950PR,Atlas 350單卡接近3倍于H20

    950PR在低精度數(shù)據(jù)格式、向量、互聯(lián)帶寬及自研HBM等方面實(shí)現(xiàn)大幅提升。 ? 芯片是華為AI
    的頭像 發(fā)表于 03-24 09:08 ?5976次閱讀

    【賽題解析】2026集創(chuàng)賽華強(qiáng)x企業(yè)命題!用國(guó)產(chǎn)AI重塑未來(lái)數(shù)字幻境!

    國(guó)產(chǎn)AI打造下一代沉浸式體驗(yàn)!2026集創(chuàng)賽“華強(qiáng)x”企業(yè)命題火熱報(bào)名中!本賽題由華強(qiáng)
    的頭像 發(fā)表于 03-11 08:04 ?767次閱讀
    【賽題解析】2026集創(chuàng)賽華強(qiáng)x<b class='flag-5'>昇</b><b class='flag-5'>騰</b>企業(yè)命題!用<b class='flag-5'>國(guó)產(chǎn)</b><b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>重塑未來(lái)數(shù)字幻境!

    邊緣AI臨界點(diǎn):深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價(jià)值

    、內(nèi)存革命:48GB/96GB LPDDR4X 背后的帶寬博弈 很多開(kāi)發(fā)者容易陷入唯論的誤區(qū),但在實(shí)際部署大模型時(shí),內(nèi)存容量和帶寬往往是真正的性能瓶頸。OrangePi AI St
    發(fā)表于 03-10 14:19

    香橙派系列開(kāi)發(fā)板如何部署OpenClaw

    OrangePi AIPro8T/20T、AI Station、AI Studio Pro、AI Studio都可以按同樣的步驟操作。 隨著香橙派
    發(fā)表于 02-25 10:13

    國(guó)產(chǎn)AI芯片真能扛住“內(nèi)卷”?海思的這波操作藏了多少細(xì)節(jié)?

    最近行業(yè)都在說(shuō)“AI的命門(mén)”,但國(guó)產(chǎn)芯片真的能接住這波需求嗎? 前陣子接觸到海思910
    發(fā)表于 10-27 13:12

    華為發(fā)布全球最強(qiáng)超節(jié)點(diǎn)和集群

    華為聯(lián)接大會(huì)2025(HUAWEI CONNECT 2025)上,華為發(fā)布最強(qiáng)超節(jié)點(diǎn)和集群,并表示將發(fā)展生態(tài)作為公司核心戰(zhàn)略,提升到
    的頭像 發(fā)表于 10-10 17:29 ?2450次閱讀

    高達(dá)2070TFLOPS視科技基于NVIDIA Jetson Thor系列模組,重磅推出AI邊緣智大腦解決方案

    視科技基于NVIDIA Jetson Thor系列模組推出的AI邊緣智大腦解決方案,以其卓越的性能和廣泛的適用性,為物理
    的頭像 發(fā)表于 07-28 18:09 ?1416次閱讀
    高達(dá)2070TFLOPS<b class='flag-5'>算</b><b class='flag-5'>力</b>|<b class='flag-5'>騰</b>視科技基于NVIDIA Jetson Thor系列模組,重磅推出<b class='flag-5'>全</b><b class='flag-5'>棧</b><b class='flag-5'>AI</b>邊緣智<b class='flag-5'>算</b>大腦解決方案

    高達(dá)2070TFLOPS視科技基于NVIDIA Jetson Thor系列模組,重磅推出AI邊緣智大腦解決方案

    視科技基于NVIDIA Jetson Thor系列模組推出的AI邊緣智大腦解決方案,以其卓越的性能和廣泛的適用性,為物理
    的頭像 發(fā)表于 07-28 16:48 ?1768次閱讀
    高達(dá)2070TFLOPS<b class='flag-5'>算</b><b class='flag-5'>力</b>|<b class='flag-5'>騰</b>視科技基于NVIDIA Jetson Thor系列模組,重磅推出<b class='flag-5'>全</b><b class='flag-5'>棧</b><b class='flag-5'>AI</b>邊緣智<b class='flag-5'>算</b>大腦解決方案

    高達(dá)2070TFLOPS視科技基于NVIDIA Jetson Thor系列模組,重磅推出AI邊緣智大腦解決方案

    視科技基于NVIDIA Jetson Thor系列模組推出的AI邊緣智大腦解決方案,以其卓越的性能和廣泛的適用性,為物理
    的頭像 發(fā)表于 07-28 16:45 ?1048次閱讀
    高達(dá)2070TFLOPS<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>騰</b>視科技基于NVIDIA Jetson Thor系列模組,重磅推出<b class='flag-5'>全</b><b class='flag-5'>棧</b><b class='flag-5'>AI</b>邊緣智<b class='flag-5'>算</b>大腦解決方案

    有關(guān) AI ,華為刷新行業(yè)記錄

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)近日,GitCode 網(wǎng)站上更新了一份題為《 AI 集群基礎(chǔ)設(shè)施高可用技術(shù)系列報(bào)告》的文件。報(bào)告顯
    的頭像 發(fā)表于 06-16 01:08 ?6453次閱讀
    有關(guān) <b class='flag-5'>AI</b> <b class='flag-5'>算</b><b class='flag-5'>力</b>,<b class='flag-5'>華為</b><b class='flag-5'>昇</b><b class='flag-5'>騰</b>刷新行業(yè)記錄
    剑阁县| 开江县| 渭源县| 肃南| 永清县| 柘城县| 宜城市| 晋江市| 遂昌县| 内丘县| 安康市| 佛山市| 海门市| 鲜城| 平凉市| 云安县| 浙江省| 秦皇岛市| 甘谷县| 远安县| 盐城市| 旬邑县| 开封县| 怀仁县| 阳春市| 浮山县| 锦屏县| 梨树县| 西充县| 商都县| 云龙县| 镇赉县| 衡南县| 耿马| 尤溪县| 晋宁县| 化德县| 岳池县| 宝清县| 确山县| 咸阳市|