在大模型趨勢下,墨芯通過領(lǐng)先的稀疏計算優(yōu)勢,助力企業(yè)加速AI應(yīng)用,商業(yè)化進(jìn)程接連取得重要突破。
近日,AI推理評測ByteMLPerf 公開了墨芯S30計算卡的評測結(jié)果。墨芯成為支持ByteMLPerf的供應(yīng)商之一。

圖:墨芯是適配Byte MLPerf(推理)的供應(yīng)商之一

圖:Byte MLPerf基準(zhǔn)套件介紹
Byte MlPerf 的評估會分為三個方面,如下:
1. Graph Compiler的易用性、擴(kuò)展性以及覆蓋率;
2. 運(yùn)行精度評估:包括數(shù)值誤差和模型跑數(shù)據(jù)集精度;
3. 運(yùn)行性能評估:不同場景下的(一般指BS不同)的吞吐和延時表現(xiàn)。
墨芯產(chǎn)品與Byte MLPerf的成功適配,標(biāo)志著墨芯的商業(yè)化進(jìn)程邁出重要一步,再度印證了稀疏計算在推理性能、能效比等方面的多重優(yōu)勢,展現(xiàn)出墨芯AI計算平臺在業(yè)務(wù)場景中的巨大應(yīng)用價值。
性能突出
凸顯應(yīng)用價值

圖:墨芯AI計算平臺在Byte MLPerf上的性能數(shù)據(jù)
基于墨芯獨(dú)創(chuàng)的雙稀疏算法與軟硬協(xié)同設(shè)計,墨芯AI計算平臺不僅支持Byte MLPerf 模型庫中的多個模型,而且以優(yōu)秀的性能與高能效比,貼合實(shí)際業(yè)務(wù)場景的需求:
01
大幅降低TCO,助力企業(yè)降本增效
稀疏計算去除了AI計算中的無效元素,因而提升計算效率,墨芯S30計算卡的峰值功耗僅為 250W,意味著降低AI計算過程中的運(yùn)營成本、基礎(chǔ)設(shè)施等成本,緩解算力昂貴等業(yè)界難題。
02
應(yīng)用場景廣泛
墨芯AI計算平臺支持Byte MLPerf 模型庫中的計算機(jī)視覺、語音、自然語言處理等多類任務(wù),適用于識別、檢測、推薦、AIGC等多種AI應(yīng)用場景,助力企業(yè)拓寬AI業(yè)務(wù)布局。
軟硬協(xié)同平臺
快速賦能AI落地
墨芯基于性能領(lǐng)先的硬件產(chǎn)品與軟件平臺,為客戶提供企業(yè)級端到端的解決方案:墨芯SparseRT 軟件開發(fā)環(huán)境全面支持硬件產(chǎn)品,為快速開發(fā)提供了完整的可擴(kuò)展平臺并激活稀疏計算的潛力。同時SparseRT 可以高效支持通用的AI編程框架,如TensorFlow、PyTorch、ONNX和MXNet等。用戶可以在熟悉的TensorFlow或PyTorch環(huán)境里進(jìn)行開發(fā)之后再進(jìn)行遷移與交付。
SparseRT獨(dú)特的SparseOPT為AI模型提供4至32倍的稀疏壓縮能力,并且易于集成到現(xiàn)有的模型交付流程中,從而充分釋放大模型的實(shí)時服務(wù)潛力。SparseRT提供可視化性能分析工具,支持離線和實(shí)時的模型性能分析,幫助開發(fā)人員分析模型中存在的瓶頸,并提供模型部署優(yōu)化建議,使開發(fā)人員能將墨芯的軟硬件解決方案幾乎零成本集成到現(xiàn)有的基礎(chǔ)設(shè)施和算法交付中。

圖 / 墨芯軟硬協(xié)同AI計算平臺
墨芯將持續(xù)與客戶緊密協(xié)作,共同探索更多AI應(yīng)用場景,以創(chuàng)新的AI計算平臺與服務(wù),為各行業(yè)的智能化升級創(chuàng)造更多價值。
審核編輯:劉清
-
加速器
+關(guān)注
關(guān)注
2文章
841瀏覽量
40232 -
人工智能
+關(guān)注
關(guān)注
1819文章
50300瀏覽量
266846
原文標(biāo)題:墨芯支持Byte MLPerf,稀疏計算助力AI應(yīng)用
文章出處:【微信號:墨芯人工智能,微信公眾號:墨芯人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
泰芯半導(dǎo)體攜手生態(tài)伙伴助力AI硬件產(chǎn)業(yè)規(guī)模化落地
墨芯人工智能千卡集群正式簽約入駐新疆算力中心
瑞芯微SOC智能視覺AI處理器
芯源的MCU都支持哪些下載器?Jlink等支持芯源的MCU下載調(diào)試嘛?
墨芯人工智能與陜西省國資算力中心達(dá)成戰(zhàn)略合作
炬芯科技正式支持Google Find Hub
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)
墨芯人工智能亮相2025外灘大會
睿海光電800G光模塊助力全球AI基建升級
墨芯人工智能WAIC 2025現(xiàn)場直擊
新品|小智墨伴,你的“口袋”AI伴侶
墨芯支持Byte MLPerf助力AI應(yīng)用
評論