2月13日晚,MiniMax正式開(kāi)源了最新旗艦?zāi)P蚆2.5。壁仞科技(06082.HK)旗艦產(chǎn)品壁礪166系列率先完成M2.5的本地化部署,成為首批完成適配的國(guó)產(chǎn)算力廠商。

M2.5在BR166服務(wù)器上基于vLLM壁仞平臺(tái)插件完成推理補(bǔ)全任務(wù)
近日,國(guó)產(chǎn)大模型生態(tài)迎來(lái)密集重磅升級(jí)。依托壁礪166系列產(chǎn)品的高通用性與全自研BIRENSUPA軟件棧的成熟度,壁仞科技此前已極速完成對(duì)GLM-5、Step?3.5?Flash等多款SOTA頂級(jí)大模型的適配支持,大幅降低開(kāi)發(fā)者的模型部署與應(yīng)用門(mén)檻,有力推動(dòng)Agent智能體技術(shù)的商業(yè)化落地與規(guī)?;卣?。
對(duì)SOTA模型的極速適配,進(jìn)一步驗(yàn)證了vLLM壁仞科技平臺(tái)插件的成熟度。通過(guò)深度集成BIRENSUPA高性能算子庫(kù),壁仞科技可針對(duì)混合專家模型及核心注意力機(jī)制實(shí)現(xiàn)指令級(jí)深度優(yōu)化,充分釋放壁礪系列產(chǎn)品算力潛能,打造兼具性能與成本優(yōu)勢(shì)的極致推理方案。
此外,面向大型MoE模型稀疏激活、DSA稀疏注意力、MTP多Token預(yù)測(cè)等關(guān)鍵特性,以及超長(zhǎng)文本的實(shí)際應(yīng)用需求,壁礪166系列產(chǎn)品與BIRENSUPA軟件棧實(shí)現(xiàn)前瞻性協(xié)同設(shè)計(jì)。產(chǎn)品充分發(fā)揮Cwarp、TDA等自研架構(gòu)優(yōu)勢(shì),深度打磨高性能算子與推理框架,真正實(shí)現(xiàn)對(duì)該類復(fù)雜模型的即刻適配。
關(guān)于MiniMax M2.5
作為定位“原生Agent(智能體)生產(chǎn)級(jí)模型”的產(chǎn)品,MiniMax M2.5在編程、工具調(diào)用和搜索、辦公等生產(chǎn)力場(chǎng)景都達(dá)到或者刷新了行業(yè)的SOTA,比如 SWE-Bench Verified(80.2%),Multi-SWE-Bench(51.3%),BrowseComp(76.3%)。

MiniMax M2.5在Agentic Engineering benchmark中取得多項(xiàng)SOTA成績(jī)
M2.5優(yōu)化了模型對(duì)復(fù)雜任務(wù)的拆解能力和思考過(guò)程中token的消耗,使其能更快地完成復(fù)雜的Agentic任務(wù),比如在SWE-Bench Verified的測(cè)試中,比上一個(gè)版本M2.1完成任務(wù)的速度快了37%。
M2.5是第一個(gè)不需要考慮使用成本可以無(wú)限使用的前沿模型。在每秒輸出100個(gè)token的情況下,M2.5連續(xù)工作一小時(shí)只需花費(fèi)1美金;而在每秒輸出50個(gè)token的情況下,只需要0.3美金。
關(guān)于GLM-5
GLM-5是智譜新一代的旗艦基座模型,面向Agentic Engineering打造,能夠在復(fù)雜系統(tǒng)工程與長(zhǎng)程Agent任務(wù)中提供可靠生產(chǎn)力。在Coding與Agent能力上,GLM-5取得開(kāi)源SOTA表現(xiàn),在真實(shí)編程場(chǎng)景的使用體感逼近Claude Opus 4.5,擅長(zhǎng)復(fù)雜系統(tǒng)工程與長(zhǎng)程Agent任務(wù),是通用Agent助手的理想基座。GLM-5模型參數(shù)規(guī)模達(dá)到744B(其中激活40B),采用28.5T數(shù)據(jù)預(yù)訓(xùn)練,并集成DeepSeek Sparse Attention,在部署成本和效率上進(jìn)一步提升。


GLM-5在BR166服務(wù)器上基于vLLM壁仞平臺(tái)插件完成推理補(bǔ)全任務(wù)
壁仞科技此前已經(jīng)完成對(duì)MiniMaxM2.1、智譜GLM-4.7等系列旗艦大模型的適配,并持續(xù)深度優(yōu)化,在模型精度和穩(wěn)定性方面表現(xiàn)優(yōu)異,充分驗(yàn)證了壁礪系列產(chǎn)品對(duì)國(guó)產(chǎn)SOTA大模型的卓越適配性。未來(lái),壁仞科技將持續(xù)加強(qiáng)對(duì)包括MiniMax、智譜、階躍星辰在內(nèi)的國(guó)產(chǎn)大模型廠商的生態(tài)適配支持,并與生態(tài)伙伴在高級(jí)智能體、項(xiàng)目級(jí)編程等Agentic Engineering領(lǐng)域共同打造“國(guó)模國(guó)芯”解決方案和示范性業(yè)務(wù)場(chǎng)景,助力中國(guó)AI產(chǎn)業(yè)向世界最先進(jìn)水平持續(xù)邁進(jìn)。
-
開(kāi)源
+關(guān)注
關(guān)注
3文章
4306瀏覽量
46398 -
模型
+關(guān)注
關(guān)注
1文章
3808瀏覽量
52241 -
算力
+關(guān)注
關(guān)注
2文章
1643瀏覽量
16824 -
壁仞科技
+關(guān)注
關(guān)注
1文章
86瀏覽量
4192
原文標(biāo)題:“國(guó)模國(guó)芯”新標(biāo)桿!壁仞科技完成MiniMax M2.5、智譜GLM-5等多款SOTA模型高效適配
文章出處:【微信號(hào):Birentech,微信公眾號(hào):壁仞科技Birentech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
壁仞科技壁礪166系列產(chǎn)品Day 0適配智譜GLM-5.1旗艦模型
登臨科技KS系列GPU產(chǎn)品全面適配MiniMax M2.5模型
沐曦曦云C500/C550 GPU產(chǎn)品深度適配MiniMax M2.5模型
華為昇騰深度適配智譜AI全新開(kāi)源模型GLM-5
大模型 ai coding 比較
Day-0支持|摩爾線程完成MiniMax M2.5模型極速適配
寒武紀(jì)實(shí)現(xiàn)對(duì)GLM-5的Day 0適配
智譜AI正式上線并開(kāi)源全新一代大模型GLM-5
摩爾線程MTT S5000率先完成對(duì)GLM-5的適配
壁仞科技壁礪166M產(chǎn)品適配模思智能MOSS-TTS Family模型
壁仞科技壁礪166系列產(chǎn)品適配階躍星辰基座模型Step 3.5 Flash
壁仞科技壁礪166M產(chǎn)品適配騰訊混元開(kāi)源翻譯模型1.5版本
壁仞科技壁礪166系列產(chǎn)品深度適配MiniMax M2.5和智譜GLM-5模型
評(píng)論