哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

寒武紀(jì)引領(lǐng)AI芯片軟件新生態(tài)

寒武紀(jì)開(kāi)發(fā)者 ? 來(lái)源:寒武紀(jì)開(kāi)發(fā)者 ? 2025-11-06 11:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

寒武紀(jì)成立的初衷是為“人工智能的大爆發(fā)”提供底層算力支持,不僅要硬件算力強(qiáng)大,更要軟件通用、易用。多年來(lái),寒武紀(jì)堅(jiān)持訓(xùn)練推理融合、統(tǒng)一的基礎(chǔ)軟件平臺(tái)研發(fā)策略,構(gòu)建從自研芯片架構(gòu)到高性能軟件平臺(tái)的完整體系,實(shí)現(xiàn)了計(jì)算架構(gòu)、編譯優(yōu)化與算法調(diào)度的深度融合:硬件為算法提供極致的并行性能與能效比,軟件則通過(guò)編譯優(yōu)化、調(diào)度策略與模型適配,讓每一份算力都被充分釋放。

寒武紀(jì)基礎(chǔ)軟件平臺(tái)CambriconNeuWare,讓用戶與開(kāi)發(fā)者能夠跨越不同的寒武紀(jì)硬件和應(yīng)用場(chǎng)景,降低上手難度,提升開(kāi)發(fā)效率,快速遷移與部署AI應(yīng)用。經(jīng)過(guò)多年投入與積累,寒武紀(jì)基礎(chǔ)軟件平臺(tái)CambriconNeuWare已經(jīng)日趨成熟,全面兼容社區(qū)最新PyTorch版本和Triton算子開(kāi)發(fā)語(yǔ)言,支持用戶模型和自定義算子快速遷移。經(jīng)過(guò)持續(xù)的全棧優(yōu)化,Cambricon NeuWare基礎(chǔ)軟件平臺(tái)在多項(xiàng)指標(biāo)上都已達(dá)到業(yè)界領(lǐng)先水平,特別針對(duì)當(dāng)前業(yè)界極具挑戰(zhàn)的大規(guī)模集群運(yùn)維實(shí)踐,進(jìn)一步豐富和完善了多項(xiàng)集群工具,為大規(guī)模訓(xùn)練推理業(yè)務(wù)在集群環(huán)境中的部署運(yùn)維調(diào)試和調(diào)優(yōu)提供了堅(jiān)實(shí)的底座。

寒武紀(jì)大模型和搜廣推訓(xùn)推解決方案,已完成大規(guī)模技術(shù)和產(chǎn)品驗(yàn)證

大模型技術(shù)正成為智能經(jīng)濟(jì)的核心驅(qū)動(dòng)力,深刻重塑人機(jī)交互的方式?!八褟V推”場(chǎng)景 —— 即搜索、廣告與推薦系統(tǒng) —— 成為大模型技術(shù)落地最具價(jià)值的前沿陣地之一。大模型賦能的搜廣推系統(tǒng),不僅帶來(lái)用戶體驗(yàn)的顯著提升,更重塑了流量分發(fā)的邏輯:讓“找信息”、“看內(nèi)容”、“買(mǎi)東西”從被動(dòng)推薦走向主動(dòng)理解,從關(guān)鍵詞匹配邁向意圖洞察。

大模型與“搜廣推”的融合,不僅是一場(chǎng)技術(shù)革新,更是商業(yè)模式的再造。寒武紀(jì)在大模型與搜廣推的訓(xùn)練推理上,都已完成了大規(guī)模的技術(shù)和產(chǎn)品驗(yàn)證。

在搜廣推訓(xùn)練方向,寒武紀(jì)穩(wěn)步推進(jìn)技術(shù)和產(chǎn)品驗(yàn)證。驗(yàn)證結(jié)果表明,解決方案可支撐多場(chǎng)景下的流式訓(xùn)練任務(wù),可持續(xù)超數(shù)月穩(wěn)定運(yùn)行,精度與穩(wěn)定性均滿足要求。持續(xù)性能優(yōu)化方面,完成Layernorm/RMSNorm/L2Norm等多種圖匹配融合,顯著提升性能。在圖融合基礎(chǔ)上進(jìn)一步優(yōu)化XLA支持,并獲得更顯著的加速比結(jié)果。

在大模型訓(xùn)練方向,寒武紀(jì)重點(diǎn)支持DeepSeek V3/V3.1、Qwen2.5/Qwen3/Qwen3-next等MoE類模型訓(xùn)練,同時(shí)擴(kuò)展了GLM4.5、Flux、Wan2.1/2.2、Qwen3-VL、Hunyuan-Video等模型的訓(xùn)練支持?;谠鶩P8的計(jì)算能力,新增Qwen/DeepSeek等系列網(wǎng)絡(luò)FP8的訓(xùn)練支持,精度符合預(yù)期。

在大模型推理方向,寒武紀(jì)研究并實(shí)踐W4A4以及MX-FP8/MX-FP4等新型數(shù)據(jù)類型,探索并支持多種高效注意力機(jī)制,包括SparseAttention與Linear Attention。

寒武紀(jì)緊跟先進(jìn)模型的演進(jìn),支持Qwen-Omni等多模態(tài)融合模型、Hunyuan3D等3D生成模型、CosyVoice等語(yǔ)音生成模型,以及DLM和VLM等新興架構(gòu),確保技術(shù)棧的先進(jìn)性與完備性。

值得一提的是,通過(guò)深度的生態(tài)合作,針對(duì)DeepSeek V3.2-Exp模型,寒武紀(jì)實(shí)現(xiàn)發(fā)布即適配的支持,并與合作伙伴同步開(kāi)源適配代碼。

與此同時(shí),持續(xù)優(yōu)化vLLM推理引擎,完善混合精度低比特量化推理機(jī)制,支持通算并行優(yōu)化,支持PD分離部署,支持基于類IBGDA的極致低時(shí)延大規(guī)模專家并行,支持Torch.compile特性優(yōu)化主機(jī)側(cè)瓶頸,實(shí)現(xiàn)了大模型應(yīng)用的全方位加速。

寒武紀(jì)持續(xù)開(kāi)展對(duì)DeepSeek、Qwen、Wan、Hunyuan等系列最新開(kāi)源模型的極致性能優(yōu)化,并專項(xiàng)攻堅(jiān)長(zhǎng)序列與超低解碼延時(shí)等場(chǎng)景的性能優(yōu)化,持續(xù)保持性能領(lǐng)先優(yōu)勢(shì)。

寒武紀(jì)能夠在大模型與“搜廣推”訓(xùn)推方面取得快速突破,完成大規(guī)模技術(shù)和產(chǎn)品驗(yàn)證,源于寒武紀(jì)長(zhǎng)期的技術(shù)深耕與軟硬協(xié)同能力。正是這種軟硬一體、兼具性能領(lǐng)先與部署高效的核心競(jìng)爭(zhēng)力,讓寒武紀(jì)能夠快速獲得市場(chǎng)信任和認(rèn)可。

e33f8a8c-b8a2-11f0-8c8f-92fbcf53809c.jpg

▲ 寒武紀(jì)基礎(chǔ)軟件平臺(tái)Cambricon NeuWare,圖中僅列舉部分組件,相關(guān)縮寫(xiě)詞注釋請(qǐng)見(jiàn)文末。

驅(qū)動(dòng)和運(yùn)行時(shí)庫(kù)

底層驅(qū)動(dòng)的高穩(wěn)定性是業(yè)務(wù)部署的重要前置條件,寒武紀(jì)的驅(qū)動(dòng)支撐業(yè)務(wù)運(yùn)行數(shù)月不停機(jī)。同時(shí),寒武紀(jì)的驅(qū)動(dòng)在業(yè)務(wù)優(yōu)化迭代中,大幅提升了吞吐能力,在極具挑戰(zhàn)的搜廣推和大模型推理場(chǎng)景中,最大限度地消除了主機(jī)側(cè)瓶頸,為端到端達(dá)成領(lǐng)先的計(jì)算效率打下了堅(jiān)實(shí)的基礎(chǔ)。寒武紀(jì)通過(guò)細(xì)粒度的并行技術(shù),解耦數(shù)據(jù)依賴和調(diào)度依賴,極限壓榨Kernel函數(shù)的吞吐能力,疊加多路DSA異步調(diào)度和協(xié)同優(yōu)化,Kernel函數(shù)調(diào)度吞吐可達(dá)每秒幾十萬(wàn)個(gè)任務(wù),實(shí)現(xiàn)業(yè)界領(lǐng)先的Kernel吞吐能力。

全面支持Kernel graph的批量下發(fā)功能,可運(yùn)行時(shí)匯聚多個(gè)算子單次下發(fā),支持在設(shè)備側(cè)駐留和下發(fā),實(shí)現(xiàn)極低延遲的多Kernel下發(fā),延時(shí)水平與國(guó)際競(jìng)品相當(dāng)。

增加類IBGDA接口,為通信庫(kù)進(jìn)行極低時(shí)延的專家并行通信提供系統(tǒng)保障。

支持豐富的設(shè)備切分使用場(chǎng)景:

visible cluster:運(yùn)行時(shí)可編程的彈性拆分,可用于快速部署;

sMLU:基于時(shí)分復(fù)用技術(shù),可用于docker快速部署;

MIM:物理劃分,全面對(duì)標(biāo)國(guó)際競(jìng)品MIG技術(shù)。

編譯器和調(diào)試調(diào)優(yōu)工具

BANG C語(yǔ)言是寒武紀(jì)BANG異構(gòu)并行編程模型的編程語(yǔ)言,在C/C++語(yǔ)言基礎(chǔ)上針對(duì)MLU架構(gòu)特點(diǎn)進(jìn)行擴(kuò)展,可以高效編寫(xiě)在MLU上運(yùn)行的并行程序,充分利用MLU大規(guī)模并行架構(gòu)來(lái)加速計(jì)算任務(wù)。BANG C支持豐富的編譯優(yōu)化技術(shù),包括鏈接時(shí)優(yōu)化(LTO)、基于Profiling反饋優(yōu)化(PGO)、基于函數(shù)調(diào)用關(guān)系的函數(shù)級(jí)片上空間復(fù)用、Device側(cè)動(dòng)態(tài)鏈接機(jī)制、編譯器靜態(tài)推導(dǎo)訪存指令地址空間、任務(wù)內(nèi)并行指令流自動(dòng)同步算法、優(yōu)化內(nèi)存依賴分析、指令級(jí)并行的局部指令調(diào)度、全局指令調(diào)度以及符合MLU架構(gòu)的高性能指令布局優(yōu)化。通過(guò)這一系列技術(shù),最大限度的發(fā)揮芯片的全部潛力,如矩陣乘法等算子可達(dá)業(yè)界領(lǐng)先的效率。

持續(xù)快速迭代Triton算子開(kāi)發(fā)語(yǔ)言,支持Triton 3.4所有特性,包括FP8/FP4的數(shù)據(jù)類型。 引入fast libentry,優(yōu)化Triton Kernel的主機(jī)端開(kāi)銷,在小Workload場(chǎng)景性能提升顯著。Triton編譯器后端實(shí)現(xiàn)多種優(yōu)化:

優(yōu)化軟件流水的片上ram占用,優(yōu)化軟件流水的并發(fā)度,實(shí)現(xiàn)平衡軟件流水性能和單指令性能的自動(dòng)軟件流水方案;

實(shí)現(xiàn)指令并行、片上ram占用、指令延遲掩蓋等多目標(biāo)的指令調(diào)度優(yōu)化;

實(shí)現(xiàn)任務(wù)并行的自動(dòng)調(diào)優(yōu)和自動(dòng)調(diào)度;

實(shí)現(xiàn)自動(dòng)循環(huán)合并;

實(shí)現(xiàn)基于算子語(yǔ)義的訪存和計(jì)算優(yōu)化,如transpose穿透和合并、slice、broadcast穿透等;

優(yōu)化指令融合和指令選擇的性能建模。

通過(guò)上述優(yōu)化,提升了TritonKernel性能泛化性,其中Matmul、FlashAttention類和HSTU類算子性能提升明顯,部分熱點(diǎn)算子已經(jīng)與手寫(xiě)算子性能相當(dāng)。

進(jìn)一步完善系統(tǒng)和算子的調(diào)試調(diào)優(yōu)工具:支持算子core dump,實(shí)現(xiàn)異?,F(xiàn)場(chǎng)的核心轉(zhuǎn)存,提供精準(zhǔn)現(xiàn)場(chǎng)和調(diào)試信息對(duì)應(yīng)關(guān)系,提供core dump文件解析工具,可快速分析定位算子出現(xiàn)異常的根因。

在主機(jī)側(cè)與設(shè)備側(cè)并行度調(diào)優(yōu)方面,CNPerf可在極低跟蹤開(kāi)銷的情況下實(shí)現(xiàn)全維度性能數(shù)據(jù)采集,可精準(zhǔn)捕獲主機(jī)側(cè)與設(shè)備側(cè)執(zhí)行流、PMU性能指標(biāo)、函數(shù)調(diào)用棧等關(guān)鍵信息,支持Kernel計(jì)算、內(nèi)存拷貝、通信任務(wù)等多類型任務(wù)追蹤,覆蓋從底層硬件到上層應(yīng)用的全棧性能數(shù)據(jù)。CNPerf-GUI智能調(diào)優(yōu)能力突出,內(nèi)置專家建議系統(tǒng)可自動(dòng)檢測(cè)設(shè)備空泡、利用率不足、集合通信等待等問(wèn)題,精準(zhǔn)定位熱點(diǎn)算子與性能瓶頸。此外CNPerf-GUI針對(duì)多機(jī)多卡場(chǎng)景,額外提供多日志自動(dòng)對(duì)時(shí)與集群迭代分析等功能,進(jìn)一步簡(jiǎn)化用戶在復(fù)雜場(chǎng)景下的調(diào)優(yōu)復(fù)雜度。

在單算子調(diào)優(yōu)方面,CNPerf可支持GHz采樣頻率的硬件工作狀態(tài)采樣,精準(zhǔn)記錄MLU前后端工作狀態(tài)。用戶可基于該功能分析流間/核間同步、算子軟件流水排布等問(wèn)題,最大化利用硬件后端資源。

CNPerf-GUI適配Linux、macOS、Windows多平臺(tái),支持CNPerf、PyTorch Profiler、Tensorflow Profiler、CNTrainKit等日志格式,且支持超大日志文件(上億函數(shù)記錄)的快速加載及流暢操作。

新增程序正確性分析工具CNSantizer,使用運(yùn)行時(shí)插樁技術(shù)自動(dòng)完成多核間競(jìng)爭(zhēng)訪問(wèn)檢測(cè)、單核內(nèi)多指令流競(jìng)爭(zhēng)訪問(wèn)檢測(cè)、Device側(cè)內(nèi)存越界訪問(wèn)檢測(cè)、未定義程序行為檢測(cè)、使用未初始化內(nèi)存檢測(cè)等。

新增程序性能分析和調(diào)優(yōu)建議工具CNAdvisor,使用運(yùn)行時(shí)插樁采集以及硬件性能計(jì)數(shù)器采集方式獲取程序運(yùn)行時(shí)狀態(tài),并根據(jù)性能調(diào)優(yōu)經(jīng)驗(yàn)庫(kù),自動(dòng)分析程序性能問(wèn)題并標(biāo)記出對(duì)應(yīng)源代碼位置,進(jìn)一步給出優(yōu)化建議。

算子庫(kù)

寒武紀(jì)計(jì)算庫(kù)積極擁抱開(kāi)源社區(qū)的技術(shù)演進(jìn),持續(xù)迭代打磨核心基礎(chǔ)算子的功能、性能和穩(wěn)定性,更快更好地支持在寒武紀(jì)智能芯片上高效、穩(wěn)定地運(yùn)行開(kāi)源和私有模型。計(jì)算庫(kù)針對(duì)搜廣推、大語(yǔ)言模型、文生圖和文生視頻等熱點(diǎn)場(chǎng)景做了深入的功能擴(kuò)展和性能優(yōu)化:

大規(guī)模Embedding Table稀疏訪存和計(jì)算極致優(yōu)化,性能與GPU競(jìng)品相當(dāng);

GEMM/BatchGEMM/GroupGEMM等矩陣乘類算子性能泛化得到顯著增強(qiáng),大規(guī)模矩陣乘HFU達(dá)到行業(yè)領(lǐng)先水平;

矩陣乘類算子支持多種社區(qū)公開(kāi)/私有定制的低精度量化功能;

支持類CUTLASS GEMM模板庫(kù)的擴(kuò)展開(kāi)發(fā)和AutoTuning;

Attention類算子在低精度加速等方向的探索和研發(fā)成果已成功完成驗(yàn)證,獲得良好的加速效果;

支持大語(yǔ)言模型使用的MTP技術(shù),開(kāi)發(fā)了用于優(yōu)化MTP性能的Top-k和Top-p采樣、隨機(jī)采樣等融合算子。

為支持計(jì)算庫(kù)的持續(xù)快速迭代,保障計(jì)算庫(kù)軟件質(zhì)量的同時(shí)做到精度性能不回退,寒武紀(jì)計(jì)算庫(kù)團(tuán)隊(duì)還打造了可靠的維測(cè)平臺(tái),提供了豐富的維測(cè)工具,開(kāi)發(fā)了高覆蓋度的功能性能測(cè)例,并制定了科學(xué)的驗(yàn)收標(biāo)準(zhǔn)。

分布式通信庫(kù)

通信庫(kù)針對(duì)大規(guī)模場(chǎng)景進(jìn)行專項(xiàng)優(yōu)化:新增HDR/DBT等Allreduce通信算法,優(yōu)先提升大規(guī)模條件下的通信帶寬,對(duì)Alltoall操作進(jìn)行深度優(yōu)化,使其大規(guī)模擴(kuò)展性達(dá)到與國(guó)際主流競(jìng)品相當(dāng)?shù)乃健Mㄐ艓?kù)同步加強(qiáng)可維可測(cè)相關(guān)的功能,支持在線打點(diǎn)、模塊化日志、高可靠服務(wù)模塊等,幫助用戶能夠快速分析通信下發(fā)錯(cuò)誤,異常卡死等問(wèn)題,提高集群通信可用性。通信庫(kù)通過(guò)在Kernel支持RoCE網(wǎng)卡的RDMA操作(類IBGDA)顯著優(yōu)化大規(guī)模專家并行場(chǎng)景下的ALL2ALL通信延遲,提升了MoE類模型推理任務(wù)的端到端吞吐。

集群工具

CntrainKit-Accu(大規(guī)模集群精度定位工具):為萬(wàn)卡分布式訓(xùn)練場(chǎng)景提供端到端精度定位,提供精度指標(biāo)在線監(jiān)控,并針對(duì)精度問(wèn)題進(jìn)行自動(dòng)化分級(jí)、采集信息、智能分析并提供對(duì)應(yīng)解決方案。CntrainKit-Accu工具還全面支持NaN/Inf異常檢測(cè)與快速定位,實(shí)現(xiàn)異常點(diǎn)級(jí)別的秒級(jí)溯源,大大提升大模型和搜廣推等場(chǎng)景的大規(guī)模訓(xùn)練精度問(wèn)題排查效率,讓每一次精度問(wèn)題都能被精準(zhǔn)捕獲。

CntrainKit-Monitor(大規(guī)模集群監(jiān)控調(diào)優(yōu)工具):實(shí)現(xiàn)對(duì)萬(wàn)卡級(jí)集群訓(xùn)練任務(wù)的實(shí)時(shí)通信與算子性能畫(huà)像,具備毫秒級(jí)任務(wù)健康可視化能力,支持算子粒度的性能剖析,識(shí)別AI作業(yè)中的性能瓶頸。具備萬(wàn)卡規(guī)模訓(xùn)練任務(wù)的“可觀、可查、可優(yōu)”能力,真正實(shí)現(xiàn)大規(guī)模集群的“問(wèn)題自感知”。

CNCE(集群監(jiān)管平臺(tái)):構(gòu)建覆蓋計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)的數(shù)據(jù)中心全景監(jiān)控體系,實(shí)現(xiàn)對(duì)十萬(wàn)卡級(jí)算力集群的秒級(jí)狀態(tài)采集與拓?fù)淇梢暬?。平臺(tái)具備自動(dòng)發(fā)現(xiàn)、智能診斷、自動(dòng)處理的閉環(huán)故障管理能力,支持萬(wàn)卡級(jí)任務(wù)的多維異常診斷與根因定位,讓用戶專注于算法創(chuàng)新與模型訓(xùn)練,無(wú)需再為底層硬件波動(dòng)分心。CNCE的上線使集群運(yùn)維從“人工巡檢”邁向“智能自治”,顯著提升大規(guī)模AI訓(xùn)練的可用性與穩(wěn)定性。

CNAnalyzeInsight(故障分析工具):CNAnalyzeInsight是智能日志分析與根因診斷引擎,支持對(duì)GB級(jí)日志的秒級(jí)檢索與多維聚合分析。具備在線實(shí)時(shí)診斷告警與離線快速分析雙模式,能夠?qū)崿F(xiàn)“異常發(fā)現(xiàn)、問(wèn)題定位、原因歸納、修復(fù)建議生成”的故障診斷閉環(huán),顯著提升訓(xùn)練任務(wù)的穩(wěn)定性與問(wèn)題處理效率。

開(kāi)源與框架

寒武紀(jì)快速跟進(jìn)社區(qū)PyTorch的進(jìn)展,支持PyTorch 2.1到PyTorch 2.8的全部社區(qū)版本。適配了包括DDP、FSDP、FSDP2、HSDP、Tensor Parallelism、Context Parallel、Pipeline Parallelism、SDPA、Inductor、MLU Graph、AOTInductor以及Inductor cppwrapper等一系列關(guān)鍵功能。Torch compile性能整體上追平GPUcompile加速比,高效支撐了產(chǎn)品在多個(gè)訓(xùn)練和推理場(chǎng)景下的成功驗(yàn)證。

寒武紀(jì)還提供GPU Migration一鍵遷移工具,幫助用戶近乎零成本將模型從GPU遷移到MLU。同時(shí)配備TorchDump精度調(diào)試工具和Torch Profiler性能調(diào)試工具,助力用戶高效定位和解決精度和性能問(wèn)題。

此外,寒武紀(jì)還支持PyTorch Lightning、TorchTitan、TorchRec等社區(qū)生態(tài),并建立快速跟進(jìn)社區(qū)版本的長(zhǎng)效機(jī)制,可在社區(qū)版本發(fā)布后2周內(nèi)實(shí)現(xiàn)MLU適配版本的發(fā)布。

通過(guò)近十年的持續(xù)打磨迭代,寒武紀(jì)已構(gòu)建出一套高效、易用、穩(wěn)定、成熟且具備高可擴(kuò)展性的軟硬一體化產(chǎn)品體系。憑借領(lǐng)先的芯片技術(shù)與完善的基礎(chǔ)軟件平臺(tái),寒武紀(jì)產(chǎn)品已經(jīng)在大模型、搜廣推、圖片與視頻生成和各類多模態(tài)的訓(xùn)練與推理場(chǎng)景中成功完成驗(yàn)證,贏得廣泛認(rèn)可。

在此過(guò)程中,寒武紀(jì)產(chǎn)品不斷接受更多大規(guī)模場(chǎng)景高強(qiáng)度檢驗(yàn),推動(dòng)軟件平臺(tái)與芯片體系持續(xù)進(jìn)化,形成了“應(yīng)用促進(jìn)優(yōu)化、優(yōu)化推動(dòng)更強(qiáng)應(yīng)用”的良性循環(huán)。

通過(guò)為用戶提供更高效、更穩(wěn)定、更廣覆蓋的支持,寒武紀(jì)加速賦能產(chǎn)業(yè)智能化轉(zhuǎn)型,推動(dòng)AI能力真正走進(jìn)千行百業(yè)。 “讓機(jī)器更好地理解和服務(wù)人類”,寒武紀(jì)的愿景正在一步一步成為現(xiàn)實(shí)。

*寒武紀(jì)基礎(chǔ)軟件平臺(tái)Cambricon NeuWare圖中標(biāo)注的縮寫(xiě)詞全稱:

1. Cambricon HLO:機(jī)器學(xué)習(xí)模型高級(jí)操作集(HLO)的寒武紀(jì)后端;

2. CNNL:Cambricon Network Library,寒武紀(jì)人工智能計(jì)算庫(kù);

3. CNNL-Extra:Cambricon CNNL Extra,寒武紀(jì)人工智能計(jì)算庫(kù)的擴(kuò)展庫(kù);

4. CNCV: Cambricon Computer Vision Library,寒武紀(jì)計(jì)算機(jī)視覺(jué)庫(kù);

5. CNCL:Cambricon Communications Library,寒武紀(jì)高性能通信庫(kù);

6. CNFFmpeg:Cambricon FFmpeg,基于開(kāi)源FFmpeg開(kāi)發(fā)的硬件加速庫(kù);

7. CNCC:Cambricon Compiler Collection,寒武紀(jì)BANG C語(yǔ)言編譯器;

8. CNAS:Cambricon Assembler,寒武紀(jì)匯編器組件;

9. CNGDB:Cambricon GNU Debugger,寒武紀(jì)BANG C語(yǔ)言調(diào)試工具;

10. CNSanitizer:Cambricon Sanitizer,寒武紀(jì)代碼檢測(cè)工具;

11. CNPAPI:Cambricon Profiling API,寒武紀(jì)性能分析接口庫(kù);

12. CNPerf:Cambricon Performance,寒武紀(jì)性能分析工具;

13. CNPerf-GUI:Cambricon Performance Graphical User Interface,寒武紀(jì)性能剖析圖形化工具;

14. CNMon:Cambricon Monitor,寒武紀(jì)設(shè)備監(jiān)控與管理命令行工具;

15. CNVS:Cambricon Validation Suite,寒武紀(jì)設(shè)備驗(yàn)證工具集;

16. CNFieldiag:Cambricon Field Diagnostic,寒武紀(jì)現(xiàn)場(chǎng)診斷工具;

17. CNAnalyzeInsight:寒武紀(jì)故障分析工具;

18. CNCL-benchmark:Cambricon Communications Library Benchmark,寒武紀(jì)通信庫(kù)性能基準(zhǔn)測(cè)試工具;

19. Cambricon Device Plugin:寒武紀(jì)設(shè)備插件;

20. CCOMP:Cambricon Cluster Operation Management Platform,寒武紀(jì)智算運(yùn)管平臺(tái)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 寒武紀(jì)
    +關(guān)注

    關(guān)注

    13

    文章

    218

    瀏覽量

    75047
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2156

    瀏覽量

    36854
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3738

    瀏覽量

    5263

原文標(biāo)題:易用好用,寒武紀(jì)引領(lǐng)AI芯片軟件新生態(tài)

文章出處:【微信號(hào):Cambricon_Developer,微信公眾號(hào):寒武紀(jì)開(kāi)發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    中國(guó)AI企業(yè)50強(qiáng)發(fā)布!寒武紀(jì)位居榜首,AI芯片公司包攬前三

    主營(yíng)業(yè)務(wù)及商業(yè)化不足的企業(yè),上榜門(mén)檻高達(dá)95億元,較2024年提升了35億元;前十名門(mén)檻更是飆升至730億元,是2024年的3倍;企業(yè)平均價(jià)值達(dá)到540億元,同比增長(zhǎng)140%。 ? 在眾多上榜企業(yè)中,AI芯片企業(yè)表現(xiàn)尤為搶眼,包攬了榜單前三名,分別是
    的頭像 發(fā)表于 01-21 09:08 ?7157次閱讀
    中國(guó)<b class='flag-5'>AI</b>企業(yè)50強(qiáng)發(fā)布!<b class='flag-5'>寒武紀(jì)</b>位居榜首,<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>公司包攬前三

    寒武紀(jì)“炸裂”財(cái)報(bào)!一季度營(yíng)收增長(zhǎng)40倍,積極備貨應(yīng)對(duì)“爆單”?

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)寒武紀(jì),交出一份炸裂財(cái)報(bào)!在4月18日,寒武紀(jì)公布了2024年年報(bào)和2025年一季度報(bào)告,其中2024年全年?duì)I收11.74億元,同比增長(zhǎng)65.56%;虧損4.52億元
    的頭像 發(fā)表于 04-22 09:07 ?3048次閱讀
    <b class='flag-5'>寒武紀(jì)</b>“炸裂”財(cái)報(bào)!一季度營(yíng)收增長(zhǎng)40倍,積極備貨應(yīng)對(duì)“爆單”?

    AI芯片企業(yè)賺瘋了?寒武紀(jì)營(yíng)收暴漲453.21%,沐曦推理GPU銷量大增866.02%

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近期,多家AI芯片企業(yè)發(fā)布2025年年度報(bào)告,包括寒武紀(jì)、海光信息、沐曦股份、天數(shù)智芯等,多家企業(yè)實(shí)現(xiàn)營(yíng)業(yè)收入大幅增長(zhǎng)。如寒武紀(jì)營(yíng)業(yè)收入同比激增453.2
    的頭像 發(fā)表于 04-11 07:31 ?9543次閱讀

    寒武紀(jì)去年?duì)I收增長(zhǎng)超400% 凈利潤(rùn)20.59億同比扭虧 寒武紀(jì)首個(gè)盈利年度

    AI芯片廠商寒武紀(jì)傳來(lái)好消息,寒武紀(jì)去年?duì)I收增長(zhǎng)超400% ;據(jù)寒武紀(jì)2025年年報(bào)顯示;25年?duì)I收達(dá)到64.97億元,同比增加453.21
    的頭像 發(fā)表于 03-13 11:49 ?1304次閱讀

    寒武紀(jì)實(shí)現(xiàn)對(duì)GLM-5的Day 0適配

    2026年2月11日,寒武紀(jì)已基于 vLLM 推理框架同步實(shí)現(xiàn)對(duì)智譜最新開(kāi)源旗艦?zāi)P??GLM-5 的適配。寒武紀(jì)一直高度重視大模型軟件生態(tài)建設(shè),借助于成熟的自研 Neuware
    的頭像 發(fā)表于 02-12 15:07 ?857次閱讀

    寒武紀(jì):預(yù)計(jì)2025年?duì)I收增長(zhǎng)超400%,凈利潤(rùn)扭虧為盈

    電子發(fā)燒友網(wǎng)報(bào)道 1月30日,寒武紀(jì)發(fā)布公告稱,經(jīng)公司財(cái)務(wù)部門(mén)初步測(cè)算,預(yù)計(jì)2025年年度營(yíng)業(yè)收入將達(dá)到600,000.00萬(wàn)元至700,000.00萬(wàn)元之間。與上年同期相比,這一數(shù)字將增加
    的頭像 發(fā)表于 01-30 18:15 ?9968次閱讀
    <b class='flag-5'>寒武紀(jì)</b>:預(yù)計(jì)2025年?duì)I收增長(zhǎng)超400%,凈利潤(rùn)扭虧為盈

    商湯科技與寒武紀(jì)達(dá)成戰(zhàn)略合作

    近日,商湯科技與中科寒武紀(jì)科技股份有限公司(以下簡(jiǎn)稱“寒武紀(jì)”)簽署面向新發(fā)展階段的戰(zhàn)略合作協(xié)議,重點(diǎn)推進(jìn)軟硬件的聯(lián)合優(yōu)化,并共同構(gòu)建開(kāi)放共贏的產(chǎn)業(yè)生態(tài)。
    的頭像 發(fā)表于 10-15 17:54 ?876次閱讀

    寒武紀(jì)成功適配DeepSeek-V3.2-Exp模型

    2025年9月29日,寒武紀(jì)已同步實(shí)現(xiàn)對(duì)深度求索公司最新模型DeepSeek-V3.2-Exp的適配,并開(kāi)源大模型推理引擎vLLM-MLU源代碼。代碼地址和測(cè)試步驟見(jiàn)文末,開(kāi)發(fā)者可以在寒武紀(jì)軟硬件平臺(tái)上第一時(shí)間體驗(yàn)DeepSeek-V3.2-Exp的亮點(diǎn)。
    的頭像 發(fā)表于 10-11 17:14 ?1838次閱讀
    <b class='flag-5'>寒武紀(jì)</b>成功適配DeepSeek-V3.2-Exp模型

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    : 介紹了7家ASIC的新創(chuàng)公司: Tachyum、Cerebras、SambaNova、Graphcore、Esperanto、Groq、Etched AI 還介紹了中國(guó)的AI芯片公司:中科
    發(fā)表于 09-12 16:07

    寒武紀(jì)股價(jià)破1200大關(guān)創(chuàng)歷史新高 DeepSeek適配國(guó)產(chǎn)芯片成直接原因

    今日,寒武紀(jì)股價(jià)突破1200元!8月單月漲幅100%、市值站上5200億,成為繼貴州茅臺(tái)之后的A股史上第二只千元股。 01 半導(dǎo)體芯片股集體爆發(fā) 寒武紀(jì)是中國(guó)AI
    的頭像 發(fā)表于 08-26 13:54 ?1151次閱讀
    <b class='flag-5'>寒武紀(jì)</b>股價(jià)破1200大關(guān)創(chuàng)歷史新高 DeepSeek適配國(guó)產(chǎn)<b class='flag-5'>芯片</b>成直接原因

    寒武紀(jì)85后創(chuàng)始人陳天石身價(jià)超1500億

    芯片生產(chǎn)和DeepSeek適配國(guó)產(chǎn)芯片的利好刺激下,加之還有國(guó)外投行高盛宣布將寒武紀(jì)-U目標(biāo)價(jià)上調(diào)50%至1835元,AI芯片龍頭
    的頭像 發(fā)表于 08-26 10:37 ?7080次閱讀

    寒武紀(jì)聯(lián)手階躍星辰成立模芯生態(tài)創(chuàng)新聯(lián)盟

    近日,階躍星辰發(fā)布了新一代基礎(chǔ)大模型Step 3。Step 3兼顧智能與效率,通過(guò)模型和系統(tǒng)聯(lián)合創(chuàng)新,實(shí)現(xiàn)了行業(yè)前列的推理解碼效率,將于7月31日面向全球企業(yè)和開(kāi)發(fā)者開(kāi)源。目前,寒武紀(jì)已初步實(shí)現(xiàn)對(duì)Step 3的支持。
    的頭像 發(fā)表于 07-31 11:26 ?1263次閱讀

    寒武紀(jì)基于思元370芯片的MLU370-X8 智能加速卡產(chǎn)品手冊(cè)詳解

    MLU370-X8智能加速卡是全面升級(jí)的數(shù)據(jù)中心訓(xùn)推一體AI加速卡,基于寒武紀(jì)全新一代思元370芯片,接口為PCIe 4.0 X16,是全高全長(zhǎng)雙寬(FHFL-Dual-Slot)的標(biāo)準(zhǔn)PCIe加速卡,適用于業(yè)內(nèi)最新的CPU平臺(tái)
    的頭像 發(fā)表于 04-24 17:57 ?6003次閱讀
    <b class='flag-5'>寒武紀(jì)</b>基于思元370<b class='flag-5'>芯片</b>的MLU370-X8 智能加速卡產(chǎn)品手冊(cè)詳解

    寒武紀(jì)思元370芯片參數(shù)特性詳解

    寒武紀(jì)首次采用chiplet技術(shù)將2顆AI計(jì)算芯粒封裝為一顆AI芯片,通過(guò)不同芯粒組合規(guī)格多樣化的產(chǎn)品,為用戶提供適用不同場(chǎng)景的高性價(jià)比AI
    的頭像 發(fā)表于 04-24 17:49 ?5849次閱讀
    <b class='flag-5'>寒武紀(jì)</b>思元370<b class='flag-5'>芯片</b>參數(shù)特性詳解

    寒武紀(jì)一季度營(yíng)收大漲4230% 凈利潤(rùn)3.55億 扭虧為盈

    4月18日晚間,國(guó)產(chǎn)AI芯片龍頭寒武紀(jì)發(fā)布了財(cái)務(wù)報(bào)告,包括有2025年第一季度財(cái)務(wù)報(bào)告和2024年年度財(cái)務(wù)報(bào)告。 在2025年第一季度,寒武紀(jì)營(yíng)收達(dá)到11.11億,同比增長(zhǎng)高達(dá)4230
    的頭像 發(fā)表于 04-19 14:15 ?1939次閱讀
    米脂县| 太和县| 营山县| 武邑县| 建宁县| 龙门县| 治县。| 赣榆县| 辽源市| 桃园市| 普定县| 菏泽市| 正定县| 汉阴县| 汤阴县| 本溪市| 祥云县| 舞钢市| 开鲁县| 内江市| 同江市| 大荔县| 漳州市| 佛教| 南溪县| 阿拉善左旗| 攀枝花市| 汶上县| 乌兰县| 哈尔滨市| 临猗县| 五华县| 买车| 潢川县| 加查县| 江都市| 梧州市| 高雄县| 杭锦后旗| 宜州市| 靖远县|