電子發(fā)燒友網(wǎng)綜合報道 4月12日,MiniMax M2.7在全球正式開源。華為昇騰、摩爾線程、沐曦股份、昆侖芯、NVIDIA,以及TogetherAI、Fireworks、Ollama等海內(nèi)外芯片廠商、推理平臺已完成Day0適配,即在開源首日已經(jīng)完成模型接入與推理適配工作。
MiniMax介紹,三周前MiniMax M2.7率先上線,開啟了模型自我進化,是業(yè)界第一個AI深度參與迭代自己的模型。M2.7能夠自行構(gòu)建復雜Agent Harness,并基于Agent Teams、復雜Skills、Tool Searchtool等能力,完成高度復雜的生產(chǎn)力任務。
基于其在真實的軟件工程、專業(yè)辦公場景的優(yōu)異表現(xiàn),M2.7已成為在Hermes Agent、OpenClaw等全球熱門智能體中最受歡迎的模型之一。來自海內(nèi)外開發(fā)者與企業(yè)客戶的接入需求持續(xù)增長,模型調(diào)用量快速提升。
開源當日,華為昇騰AI基礎(chǔ)軟硬件實現(xiàn)首日適配,基于vllm-Ascend推理引擎在Atlas800A3、Atlas800IA2系列產(chǎn)品上為模型的推理部署提供全流程支持;摩爾線程技術(shù)團隊基于MUSA架構(gòu),針對M2.7的模型特點,完成深度調(diào)優(yōu),成功在MTTS5000上實現(xiàn)模型的高性能推理;沐曦曦云C系列GPU,憑借全棧自研的MXMACA軟件棧,首日完成深度適配,實現(xiàn)“模型發(fā)布即算力就緒”的Day0體驗。
此外,昆侖芯依托自研架構(gòu),通過底層算子優(yōu)化與軟硬件協(xié)同加速,保障M2.7在平臺上的穩(wěn)定、高效運行表現(xiàn)。NVIDIA推理框架TensorRT-LLM為M2.7提供了深度適配與全面優(yōu)化支持,幫助開發(fā)者和企業(yè)用戶高效完成模型部署與上線。TogetherAI、Fireworks、Ollama、vLLM、SGLang和智源眾智FlagOS、魔搭等海內(nèi)外開發(fā)平臺與社區(qū)已同步在首日接入MiniMax M2.7模型并完成適配。
在 AI 大模型和芯片領(lǐng)域,“適配”是一個關(guān)鍵的技術(shù)術(shù)語。簡單來說,它指的是讓一個軟件(在這里是 MiniMax M2.7 模型)能夠在特定的硬件(如摩爾線程、沐曦的 GPU)或軟件平臺(如英偉達的推理框架)上順利、高效地運行起來的一整套技術(shù)工作。
“適配”具體包含哪些工作?
底層算子優(yōu)化:大模型由無數(shù)個基礎(chǔ)的數(shù)學計算(即“算子”)構(gòu)成。不同的芯片架構(gòu)(如英偉達的 CUDA、摩爾線程的 MUSA)執(zhí)行這些計算的方式和效率都不同。適配工作就是針對特定芯片的架構(gòu),對這些算子進行重寫和優(yōu)化,讓它們跑得更快、更穩(wěn)。
推理框架集成:模型需要通過一個“中間人”——推理框架(如 vLLM、TensorRT-LLM)來調(diào)用硬件資源。適配意味著要將模型無縫集成到這些框架中,確??蚣苣苷_、高效地指揮芯片進行計算。
性能深度調(diào)優(yōu):這是適配的核心目標。包括優(yōu)化顯存管理、降低計算延遲、提高吞吐量等。例如,針對 MiniMax M2.7 支持超長上下文的特點,摩爾線程就利用其 MTT S5000 的大顯存和高帶寬進行了專門優(yōu)化,以支撐模型長時間、多步驟的穩(wěn)定執(zhí)行。
為什么“Day 0 適配”如此重要?
這次 MiniMax M2.7 開源能獲得“Day 0 適配”(即發(fā)布當天完成適配),具有非常重要的意義:
對開發(fā)者而言:意味著“開箱即用”。開發(fā)者無需自己花費大量時間和精力去解決兼容性問題,可以在模型發(fā)布的第一時間就上手使用,極大地加速了應用開發(fā)和創(chuàng)新的進程。
對芯片廠商而言:這是展示其技術(shù)實力和生態(tài)成熟度的絕佳機會。能夠快速適配最前沿的大模型,證明了其硬件和軟件棧的競爭力與兼容性,有助于吸引更多開發(fā)者和企業(yè)客戶。
對 MiniMax 而言:廣泛的硬件支持意味著其模型可以觸達更廣泛的用戶群體,不再受限于單一硬件平臺,從而加速其技術(shù)的商業(yè)落地和生態(tài)建設(shè)。
總而言之,“適配”是連接 AI 模型與算力的橋梁。這次 MiniMax M2.7 與多家國產(chǎn)及海外芯片廠商在首日就完成適配,不僅體現(xiàn)了模型本身的開放性和重要性,也反映了國產(chǎn) AI 芯片生態(tài)正在快速成熟,能夠跟上全球最先進模型的發(fā)展步伐。
-
摩爾線程
+關(guān)注
關(guān)注
2文章
284瀏覽量
6602 -
沐曦
+關(guān)注
關(guān)注
1文章
96瀏覽量
1873
發(fā)布評論請先 登錄
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配百度文心ERNIE-Image文生圖模型
海光DCU Day0適配百度文心ERNIE-Image文生圖模型
天數(shù)智芯Day 0適配MiniMax最新開源M2.7大模型
Day-0支持|摩爾線程率先完成MiniMax M2.7大模型適配
沐曦股份曦云C系列GPU產(chǎn)品Day 0適配智譜GLM-5.1旗艦模型
沐曦股份曦云C系列GPU全面適配通義千問Qwen3.5三款新模型
沐曦股份曦云C系列GPU深度適配通義千問Qwen3.5模型
沐曦曦云C500/C550 GPU產(chǎn)品深度適配MiniMax M2.5模型
Day-0支持|摩爾線程完成MiniMax M2.5模型極速適配
沐曦曦云C500/C550 GPU產(chǎn)品適配智譜GLM-OCR模型
沐曦曦云C600 GPU產(chǎn)品適配階躍星辰基座模型Step 3.5 Flash
沐曦股份曦云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型
MiniMax M2.7全球開源,摩爾線程、沐曦等完成Day0適配
評論