哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

在AI基礎設施中部署大語言模型的三大舉措

穎脈Imgtec ? 2026-02-09 16:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

文:Gartner研究副總裁周玲


中國企業(yè)機構已逐步在生產環(huán)境中運行或者計劃運行大語言模型,但在AI基礎設施的生產部署與高效運營方面仍面臨諸多挑戰(zhàn)。目前,中國正加速提升其生成式AI能力,覆蓋大語言模型、軟件開發(fā)、生態(tài)集成與硬件革新。隨著DeepSeek、通義千問(Qwen)等高性價比模型日益普及和本地部署的深入推進,越來越多的中國企業(yè)將重心放在數(shù)據(jù)隱私、數(shù)據(jù)主權、安全性、可擴展性和低延遲等核心需求上。2025年Gartner首席信息官(CIO)和技術高管調研顯示,2025年中國企業(yè)計劃大幅增加在生成式AI和AI領域的技術投資,其平均增幅分別達到40.3%和33.3%(見圖1),這一數(shù)據(jù)表明,相關技術將在短期內得到廣泛采用。

3e6abd4c-0591-11f1-96ea-92fbcf53809c.png

Gartner預測,到2028年,中國70%的大型企業(yè)將為大語言模型在AI基礎設施上的部署建立完善的治理框架,而2025年這一比例不足10%。

然而,要成功實現(xiàn)大語言模型在AI基礎設施中的生產部署并非易事,需要制定復雜的技術、運維和治理戰(zhàn)略,以確保模型達到性能指標(例如GPU算力利用率),同時保障數(shù)據(jù)安全與合規(guī)。

中國企業(yè)與全球企業(yè)的一個關鍵區(qū)別在于,其更傾向于在本地AI基礎設施環(huán)境中部署大語言模型,這對I&O團隊提出了更高要求,需要他們對重要AI基礎設施技術棧有更深入的理解。AI基礎設施是指AI應用構建、測試、訓練與部署所需的最新、最先進的硬軟件技術棧。

為了在新的AI基礎設施上成功實現(xiàn)大語言模型的生產部署,企業(yè)應從以下三個方面著手:構建全面的生產發(fā)布策略;制定健全的治理框架;并加強與法律、安全、AI、數(shù)據(jù)團隊及生態(tài)伙伴的緊密協(xié)作。這些舉措為大語言模型在生產環(huán)境中的高效運行提供了堅實的保障。


構建全面的部署戰(zhàn)略

隨著企業(yè)開始在AI基礎設施上部署大語言模型,I&O領導者所面臨的壓力日益增大,需要幫助AI開發(fā)人員和工程師在全企業(yè)范圍內以更快的速度、更大的規(guī)模來推進AI項目的開發(fā)和部署。與此同時,針對不同用戶和應用場景不斷涌現(xiàn)的各種AI工具和服務,顯著增加了評估與選擇的難度和復雜性。此外,傳統(tǒng)的生產發(fā)布策略與流程已無法有效支持大語言模型在AI基礎設施中的生產部署需求。因此,I&O領導者亟需制定完善的生產發(fā)布戰(zhàn)略,以保障部署工作的順利進行。

然而,要為大語言模型在AI基礎設施上的部署構建一套穩(wěn)健的戰(zhàn)略,就需要從整體視角出發(fā),包括適配AI基礎設施環(huán)境、為特定場景設計架構、實施技術優(yōu)化以及確保符合監(jiān)管框架要求。

中國的I&O領導者應:

使部署策略與企業(yè)數(shù)字化轉型戰(zhàn)略保持一致

按照使用場景構建多層次部署架構以優(yōu)化性能

優(yōu)化模型與推理以提升效率

使用云原生技術實現(xiàn)靈活調度

加強合規(guī)并強化安全管理

建立全鏈路監(jiān)控與成本控制機制


制定穩(wěn)健的部署治理流程

大語言模型已經從研究原型轉變?yōu)槎喾N任務的關鍵核心組件,包括客戶支持AI智能體、法律文檔摘要、代碼生成或測試工具、企業(yè)級代理型AI用例以及多模態(tài)應用等領域。然而,大語言模型在AI基礎設施中的生產部署需要解決如下幾個固有挑戰(zhàn):

資源密集

非確定性行為與提示敏感

延遲與吞吐限制

安全與隱私

因此,為了成功將大語言模型部署到AI基礎設施的生產環(huán)境中,中國的I&O部門必須建立一套穩(wěn)健的治理流程,采取切實可行的步驟促進資源管理、持續(xù)監(jiān)控以及敏捷更新。比如:

提前規(guī)劃并進行試點

確定產品部署位置

建立高效的資源管理

在大語言模型生產發(fā)布流程中嵌入安全治理與提示治理

管理版本并執(zhí)行A/B測試

采用持續(xù)集成/持續(xù)交付流程

實施生產監(jiān)控


促進關鍵利益相關方之間的緊密協(xié)作

部署大語言模型十分復雜,要求業(yè)務、法務、安全以及AI與數(shù)據(jù)團隊以協(xié)同一致的方式共同工作。過去各自獨立的部門如今必須從大語言模型項目的啟動階段就開展合作,以確保技術開發(fā)能夠反映法律和安全方面的考量。建立跨職能的AI治理委員會至關重要,成員應包括法務、安全、數(shù)據(jù)工程與數(shù)據(jù)科學、產品管理、軟件開發(fā)以及高管層的代表。

文章來源:Gartner

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    40820

    瀏覽量

    302427
  • 人工智能
    +關注

    關注

    1819

    文章

    50264

    瀏覽量

    266682
  • 語言模型
    +關注

    關注

    0

    文章

    573

    瀏覽量

    11337
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI模型訓練與部署實戰(zhàn) | 線下免費培訓

    流程與部署實戰(zhàn)”免費培訓!以人形檢測模型部署與優(yōu)化實戰(zhàn)為基礎,聚焦嵌入式AI落地的核心環(huán)節(jié),提供硬件,動手實操,帶你半天時間內,走通從
    的頭像 發(fā)表于 04-07 13:08 ?553次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>模型</b>訓練與<b class='flag-5'>部署</b>實戰(zhàn) | 線下免費培訓

    【瑞薩AI挑戰(zhàn)賽】手寫數(shù)字識別模型RA8P1 Titan Board上的部署

    提供了高性能、高易用性的硬件平臺,而E2Studio與ruhmi框架的組合,大幅降低了模型端側部署的門檻,相信工業(yè)檢測、智能穿戴、智能家居等領域,該開發(fā)板與端側AI
    發(fā)表于 03-15 20:42

    云天勵飛中標湛江市AI滲透支撐新質生產力基礎設施建設項目

    日前,云天勵飛中標湛江市AI滲透支撐新質生產力基礎設施建設項目。根據(jù)項目規(guī)劃,公司將基于自研國產AI推理加速卡,參與建設AI推理算力集群,并推動DeepSeek等國產大
    的頭像 發(fā)表于 03-14 09:04 ?664次閱讀

    為何CPU是AI基礎設施的核心

    人工智能 (AI) 并非一種具有單一理想基礎設施的單一工作負載。AI 涵蓋了多樣化的工作負載,需要系統(tǒng)層面的協(xié)同策略,才能高效且可擴展地提供性能。而在這一策略中,CPU 扮演著核心角色,它作為系統(tǒng)的智能層,統(tǒng)籌協(xié)調云端、數(shù)據(jù)中心
    的頭像 發(fā)表于 03-11 10:35 ?1003次閱讀

    華為推動電信云加速向AI基礎設施演進

    隨著AI技術持續(xù)突破,人工智能正成為全球產業(yè)升級的核心驅動力。從通用大模型到行業(yè)智能應用,AI已成為新一輪科技變革和產業(yè)升級的核心驅動力。業(yè)界正加快推進體系化探索,圍繞AI
    的頭像 發(fā)表于 02-27 09:43 ?372次閱讀

    模型 ai coding 比較

    方裁判更客觀 樣本量說明:當前樣本量30題,統(tǒng)計意義有限,建議后續(xù)擴大到100+題 數(shù)據(jù)污染風險:評估經典題目被模型訓練集見過的可能性 6. 環(huán)境一致性維度 所有模型完全相同的環(huán)
    發(fā)表于 02-19 13:43

    AI端側部署開發(fā)(SC171開發(fā)套件V3)2026版

    AI端側部署開發(fā)(SC171開發(fā)套件V3)2026版 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉化指南 27分19秒 http
    發(fā)表于 01-15 10:31

    亞馬遜云科技推出全新的Amazon AI Factories 將客戶現(xiàn)有基礎設施轉化為高性能AI環(huán)境

    亞馬遜云科技2025 re:Invent全球大會上,宣布推出全新的Amazon AI Factories,助力企業(yè)將現(xiàn)有基礎設施轉化為高性能的AI環(huán)境。
    的頭像 發(fā)表于 12-13 13:44 ?819次閱讀

    使用瑞薩RUHMI工具實現(xiàn)AI模型部署過程

    AI無處不在。你部署AI,你的競爭對手也部署AI
    的頭像 發(fā)表于 10-17 10:00 ?2902次閱讀
    使用瑞薩RUHMI工具實現(xiàn)<b class='flag-5'>AI</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b>過程

    科士達全棧解決方案亮相2025 ODCC,驅動綠色AI智算基礎設施革新

    2025年開放數(shù)據(jù)中心大會(ODCC)于9月9日-11日北京國際會議中心盛大啟幕。本屆峰會以“擁抱AI變革,點燃算網引擎”為主題,聚焦AI爆發(fā)背景下算力基礎設施面臨的能效、
    的頭像 發(fā)表于 09-17 15:40 ?1368次閱讀
    科士達全棧解決方案亮相2025 ODCC,驅動綠色<b class='flag-5'>AI</b>智算<b class='flag-5'>基礎設施</b>革新

    ai_cube訓練模型最后部署失敗是什么原因?

    ai_cube訓練模型最后部署失敗是什么原因?文件保存路徑里也沒有中文 查看AICube/AI_Cube.log,看看報什么錯?
    發(fā)表于 07-30 08:15

    摩爾線程“AI工廠”:以系統(tǒng)級創(chuàng)新定義新一代AI基礎設施

    演講中表示,為應對生成式AI爆發(fā)式增長下的大模型訓練效率瓶頸,摩爾線程將通過系統(tǒng)級工程創(chuàng)新,構建新一代AI訓練基礎設施,致力于為AGI時代打造生產先進
    發(fā)表于 07-28 10:34 ?2899次閱讀
    摩爾線程“<b class='flag-5'>AI</b>工廠”:以系統(tǒng)級創(chuàng)新定義新一代<b class='flag-5'>AI</b><b class='flag-5'>基礎設施</b>

    Arm如何助力AI基礎設施變革

    眾所周知,人工智能 (AI) 有望革新人類活動的方方面面。然而,要充分釋放這一潛力,就必須面對一個基本事實:支撐傳統(tǒng)計算的基礎設施已無法滿足未來 AI 發(fā)展的需求。
    的頭像 發(fā)表于 07-03 14:29 ?1116次閱讀

    歐洲聯(lián)手NVIDIA打造AI基礎設施

    NVIDIA 于近日宣布,其正在攜手歐洲各國、科技和行業(yè)領導者,共同建造 NVIDIA Blackwell AI 基礎設施,以強化數(shù)字主權、支撐經濟增長,并推動歐洲大陸成為 AI 工業(yè)革命的領導者。
    的頭像 發(fā)表于 06-16 14:25 ?1621次閱讀

    企業(yè)部署AI模型怎么做

    當下,AI模型已成為驅動決策自動化、服務智能化與產品創(chuàng)新的核心引擎。然而,企業(yè)面對動輒數(shù)百億參數(shù)的大模型部署時,常陷入算力不足、響應延遲高、成本失控等困境。如何突破瓶頸,實現(xiàn)高效、穩(wěn)
    的頭像 發(fā)表于 06-04 09:26 ?989次閱讀
    扶沟县| 赤壁市| 三门县| 宜君县| 阳朔县| 满洲里市| 旬阳县| 永顺县| 定兴县| 北流市| 苏尼特左旗| 衡南县| 吉林市| 武隆县| 鄂托克旗| 九寨沟县| 鞍山市| 安陆市| 错那县| 保定市| 金乡县| 云南省| 怀来县| 庆云县| 万山特区| 互助| 武城县| 师宗县| 称多县| 南和县| 桐庐县| 南丰县| 梧州市| 金沙县| 日土县| 温宿县| 元江| 藁城市| 晋州市| 页游| 乌兰察布市|