哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

積算科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型算力

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2025-07-30 21:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


北京2025年7月30日 /美通社/ -- 近日,北京積算科技有限公司(以下簡稱"積算科技")宣布其算力服務(wù)平臺上線赤兔推理引擎。積算科技PowerFul-AI應(yīng)用開發(fā)平臺與赤兔合作,打造高性價比的模型輕量化部署方案。用戶通過遠(yuǎn)程算力平臺預(yù)置的模型鏡像與AI工具,僅需50%的GPU算力即可解鎖大模型推理、企業(yè)知識庫搭建、智能體開發(fā),加速大模型在智能問答、報告生成、客服助手、智能體等典型行業(yè)場景的落地。


赤兔推理引擎由北京清程極智科技有限公司(以下簡稱"清程極智")開發(fā),并聯(lián)合清華大學(xué)團(tuán)隊(duì)發(fā)布開源版本。其核心價值在于,打破了FP8模型原生部署時GPU必須支持FP8精度的要求。通過底層算子優(yōu)化(如GeMM、MoE的指令級重構(gòu))和編譯技術(shù)創(chuàng)新,赤兔早在今年三月即首次實(shí)現(xiàn)在非FP8精度卡上原生運(yùn)行FP8高精度模型,并確保推理過程幾乎零精度損失。

積算科技聯(lián)合清程極智,完成了赤兔推理引擎在積算科技PowerFul-AI應(yīng)用開發(fā)平臺上的驗(yàn)證測試。測試結(jié)果表明,赤兔推理引擎在積算科技PowerFul-AI平臺上運(yùn)行穩(wěn)定、性能表現(xiàn)優(yōu)異,滿足雙方兼容性認(rèn)證的各項(xiàng)標(biāo)準(zhǔn),能夠快速完成DeepSeek、Qwen等大模型推理部署,并支持基于非FP8精度GPU卡實(shí)現(xiàn)FP8模型部署,相比于使用BF16精度部署,GPU算力需求減半。以部署DeepSeek-R1-671B為例,原需4臺8卡機(jī)2560GB顯存,現(xiàn)僅需2臺8卡機(jī)1280GB顯存即可滿足要求。

積算科技PowerFul-AI平臺攜手赤兔推理引擎,將為AI大模型應(yīng)用開發(fā)打造"成本減半、零性能損耗"的解決方案,提供構(gòu)建企業(yè)知識庫開發(fā)、智能體搭建等功能,助力企業(yè)用戶靈活快速構(gòu)建大模型通用應(yīng)用及個性化端到端解決方案。

PowerFul-AI是積算科技的大模型應(yīng)用落地解決方案,能夠?yàn)锳I大模型落地應(yīng)用提供高效、易用、安全的端到端開發(fā)平臺,幫助企業(yè)及科研機(jī)構(gòu)高效開發(fā)部署AI大模型應(yīng)用。目前,PowerFul-AI已經(jīng)全面適配DeepSeek R1、DeepSeek V3等模型。用戶只需選擇鏡像和模型文件,并配置模型所需的算力資源,即可快速完成模型部署,實(shí)現(xiàn)DeepSeek的"分鐘級"上線。

積算科技誕生于全球生成式AI浪潮,專注于智能算力服務(wù)市場,致力于成為中國最具價值的智能算力服務(wù)商,聚焦互聯(lián)網(wǎng)、運(yùn)營商、高校、新能源汽車等領(lǐng)域的多家頭部客戶提供算力服務(wù)。公司擁有萬卡級先進(jìn)智能算力資源池,提供裸金屬、智能算力系統(tǒng)、專屬智能算力系統(tǒng)等算力服務(wù)產(chǎn)品,適用于大模型訓(xùn)練與推理、算法研究、大數(shù)據(jù)分析、自動駕駛、智能科學(xué)計算等多元場景。其運(yùn)維和服務(wù)團(tuán)隊(duì)具備大規(guī)模智能算力系統(tǒng)設(shè)計建設(shè)、大模型開發(fā)應(yīng)用及性能優(yōu)化能力,可提供全棧大模型應(yīng)用開發(fā)服務(wù)支持,并根據(jù)客戶需求提供靈活服務(wù)模式。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40820

    瀏覽量

    302424
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3738

    瀏覽量

    5263
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    海光DCU完成階躍星辰基座模型Step 3.5 Flash推理適配

    近日,海光DCU正式完成對階躍星辰旗艦開源基座模型Step 3.5 Flash的全流程適配與深度調(diào)優(yōu)。得益于新一代海光DCU原生支持FP8精度、超越主流旗艦產(chǎn)品的更大顯存等核心優(yōu)勢,高效完成Step 3.5 Flash FP8
    的頭像 發(fā)表于 03-26 09:48 ?565次閱讀

    邊緣AI臨界點(diǎn):深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價值

    Station的出現(xiàn),標(biāo)志著邊緣AI不再僅僅是“云端的縮水版”,而是具備獨(dú)立生命周期的“邊緣原生”節(jié)點(diǎn) 。它不僅能在本地完成推理,還能通過豐富的接口控制物理世界,通過大內(nèi)存加載復(fù)雜的決策
    發(fā)表于 03-10 14:19

    Hailo-8卡 + RK3588實(shí)測!26TOPS加持,助力AI視覺升級!

    近年來,AI視覺在邊緣端應(yīng)用廣泛,行業(yè)對AI推理硬件的要求也日益提升。傳統(tǒng)CPU在CNN等視覺模型推理任務(wù)中逐漸顯露瓶頸,而專用AI加速器成為破局的關(guān)鍵。 Hailo-8 AI
    的頭像 發(fā)表于 03-02 16:46 ?315次閱讀
    Hailo-<b class='flag-5'>8</b><b class='flag-5'>算</b><b class='flag-5'>力</b>卡 + RK3588實(shí)測!26TOPS加持,助力AI視覺升級!

    從訓(xùn)練到推理:大模型需求的新拐點(diǎn)已至

    在大模型產(chǎn)業(yè)發(fā)展的早期階段,行業(yè)焦點(diǎn)主要集中在大模型訓(xùn)練所需的投入。一個萬億參數(shù)大模型的訓(xùn)練可能需要數(shù)千張GPU芯片連續(xù)運(yùn)行數(shù)月,成本高
    的頭像 發(fā)表于 02-05 16:07 ?990次閱讀
    從訓(xùn)練到<b class='flag-5'>推理</b>:大<b class='flag-5'>模型</b><b class='flag-5'>算</b><b class='flag-5'>力</b>需求的新拐點(diǎn)已至

    進(jìn)迭時空發(fā)布新一代RISC-V AI CPU芯片,滿足端側(cè)大模型需求

    FP8數(shù)據(jù)精度原生AI推理,還是首顆完整支持芯片級虛擬化的RISC-V產(chǎn)品。 ? 硬件配置上,K3配備8顆高性能X100大核,主頻2.4GHz,單核性能與ARM A76相當(dāng),60TOPS的AI
    的頭像 發(fā)表于 01-30 14:06 ?9399次閱讀

    華為榮獲服務(wù)商互聯(lián)能力成熟度模型參編證書

    在2025互聯(lián)網(wǎng)大會期間,互聯(lián)網(wǎng)服務(wù)論壇在成都成功舉辦。論壇現(xiàn)場舉行了《
    的頭像 發(fā)表于 12-31 11:50 ?762次閱讀

    從云端集中到邊緣分布:邊緣智如何重塑網(wǎng)絡(luò)布局

    隨著大模型推理延遲進(jìn)入毫秒級時代,整個科技行業(yè)都意識到:網(wǎng)絡(luò)的規(guī)則正在被改寫。這場變革的核心,正是從云端集中式計算向邊緣分布式智能的范式轉(zhuǎn)移。據(jù)行業(yè)多家分析機(jī)構(gòu)綜合預(yù)測,全球AI基
    的頭像 發(fā)表于 12-25 11:34 ?570次閱讀
    從云端集中到邊緣分布:邊緣智<b class='flag-5'>算</b>如何重塑<b class='flag-5'>算</b><b class='flag-5'>力</b>網(wǎng)絡(luò)布局

    積木+3D堆疊!GPNPU架構(gòu)創(chuàng)新,應(yīng)對AI推理需求

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)2025年,人工智能正式邁入應(yīng)用推理時代。大模型從實(shí)驗(yàn)室走向千行百業(yè),推理需求呈指數(shù)級爆發(fā)。然而,高昂的推理成本與有限的
    的頭像 發(fā)表于 12-11 08:57 ?8023次閱讀

    湘軍,讓變成生產(chǎn)

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    國產(chǎn)AI芯片真能扛住“內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?

    反而壓到了310W。更有意思的是它的異構(gòu)架構(gòu):NPU+CPU+DVPP的組合,居然能同時扛住訓(xùn)練和推理場景,之前做自動駕駛算法時,用它跑模型時延直接降了20%。 但疑惑也有:這種
    發(fā)表于 10-27 13:12

    中科曙光以生態(tài)賦能行業(yè)創(chuàng)新

    近日,“橘洲”V1端側(cè)版作為國內(nèi)首個基于國產(chǎn)預(yù)訓(xùn)練的視覺基座大模型在長沙上線,驚艷四座。“橘洲”可在手機(jī)端實(shí)現(xiàn)1024×1024分辨率圖像的秒級生成,具有成本低、質(zhì)量高、速度快、輕
    的頭像 發(fā)表于 09-24 09:26 ?1372次閱讀

    與電力的終極博弈,填上了AIDC的“電力黑洞”

    ),專注于提供人工智能訓(xùn)練與推理所需的服務(wù)、數(shù)據(jù)服務(wù)和算法服務(wù)。AIDC采用異構(gòu)計算架構(gòu),結(jié)
    的頭像 發(fā)表于 09-22 02:43 ?8918次閱讀

    杭州靈汐類腦智集群實(shí)現(xiàn)大模型快速推理

    據(jù)悉,“杭州靈汐類腦智集群”已于7月底實(shí)現(xiàn)了大模型快速推理API的企業(yè)服務(wù)試運(yùn)行。該集群由杭州靈汐類腦科技有限公司牽頭搭建運(yùn)營,中國電信、中國電子科技南湖研究院以及腦啟社區(qū)作為合作方
    的頭像 發(fā)表于 08-18 16:06 ?1086次閱讀

    超低延時重構(gòu)AI推理體驗(yàn)!白山云發(fā)布“大模型API”產(chǎn)品

    優(yōu)勢,打造超低延時、超穩(wěn)定、簡單易用的API接口服務(wù),降低大模型應(yīng)用成本和開發(fā)門檻,助力企業(yè)和個人用戶快速開啟AI創(chuàng)新之旅。專注邊緣推理,構(gòu)建“云邊端”
    的頭像 發(fā)表于 07-02 17:26 ?1237次閱讀
    超低延時重構(gòu)AI<b class='flag-5'>推理</b>體驗(yàn)!白山云發(fā)布“大<b class='flag-5'>模型</b>API”產(chǎn)品

    軟通智中標(biāo)韶關(guān)公共服務(wù)平臺項(xiàng)目

    日前,軟通動力旗下軟通智中標(biāo)《韶關(guān)公共服務(wù)平臺(一體化網(wǎng)
    的頭像 發(fā)表于 05-22 16:19 ?1123次閱讀
    清水河县| 九龙坡区| 睢宁县| 卫辉市| 瑞安市| 永昌县| 淮滨县| 乐亭县| 巨野县| 金秀| 长沙县| 兴隆县| 泰安市| 温宿县| 绥棱县| 垫江县| 汽车| 偃师市| 丹寨县| 鹿泉市| 全南县| 马尔康县| 房产| 垦利县| 博白县| 民勤县| 屏边| 依安县| 铜陵市| 河源市| 札达县| 勃利县| 桐柏县| 汨罗市| 什邡市| 永平县| 洛浦县| 河西区| 富裕县| 突泉县| 晋中市|