案例介紹
金山辦公與 NVIDIA 團隊合作,通過 NVIDIA Tensor Core GPU、TensorRT 提升圖像文檔識別與理解的推理效率;借助 NVIDIA Triton 推理服務器的部署,成功優(yōu)化 GPU 利用率,提供高推理吞吐量。
客戶簡介及應用背景
金山辦公是一家辦公軟件和服務提供商,主要從事 WPS Office 辦公軟件產(chǎn)品及服務的設計研發(fā)及銷售推?。產(chǎn)品包括 WPS Office 辦公軟件、???檔等協(xié)同辦公產(chǎn)品、圖像文檔識別與理解業(yè)務,可在 Windows、Linux、macOS、Android、iOS 、Harmony 等眾多主流操作平臺上應?,于全球也有越來越多的用戶樂享金山辦公提供的產(chǎn)品和服務。
在辦公場景中,文檔類型圖像被廣泛使用,比如證件、發(fā)票、合同、保險單、掃描書籍、拍攝的表格等,這類圖像包含了大量的純文本信息,還包含有表格、圖片、印章、手寫、公式等復雜的版面布局和結構信息。早前這些信息均采用人工來處理,需要耗費大量人力,很大程度上阻礙了企業(yè)的辦公效率 。其圖像文檔識別與內(nèi)容理解業(yè)務就是為了解決此類用戶痛點。
自 2017 年以來的不斷耕耘,金山辦公在圖像文檔識別與理解領域已達到了國內(nèi)領先水平。其主要使用了 CV(Computer Vision)與 VIE(Visual Information Extraction 視覺信息抽?。?等相關深度學習技術,例如通過 CV 技術識別發(fā)票和 PDF 大綱并獲取其中的數(shù)據(jù)關系,其日請求次數(shù)已達上億次。
客戶挑戰(zhàn)
圖像識別與理解是一個很復雜的過程,一個任務的 pipeline 用到的深度學習模型多達 20+ 個,且日請求量級較大(上億級別)需要大量的計算資源。當業(yè)務落地時,團隊主要面臨以下兩個挑戰(zhàn):
1、任務的絕對耗時不能過長。
2、成本問題。
應用方案
為了解決上訴的兩個挑戰(zhàn),金山辦公采用了 NVIDIA T4 Tensor Core GPU 進行推理、NVIDIA TensorRT 8.2.4 進行模型加速、NVIDIA Triton 推理服務器 22.04 在 K8S 上進行模型部署與編排。
長鏈路(多達 20+ 個模型的 pipeline)意味著長耗時,若基于 CPU 推理的話,pipeline 耗時會長達 15 秒左右,通過 GPU 推理和 TensorRT 加速,成功將耗時降低到了 2.4 秒左右。
模型部署的時候,常見的做法是推理與業(yè)務代碼(前后處理)放在一個進程空間里,每個模型需要在每個進程中加載一次,由于顯存的限制,很多時候難以得到較高的單卡 GPU 使用率。就算采用了進程池的方式提高了單卡的 GPU 利用率,也會因 CPU 的限制,出現(xiàn)機器整體的 GPU 利用率不高。而在引入了 Triton 推理服務器進行推理部署后,將推理與業(yè)務代碼解耦,初步實現(xiàn)將 GPU 資源池化調(diào)度。最終在同等業(yè)務規(guī)模情況下,部署成本節(jié)省了 23%。
模型耗時

表1 模型耗時
模型吞吐量對比圖



WPS 生成式 AI 的最新進展
WPS AI 緊跟業(yè)界潮流,再發(fā)布新 AI 能力,覆蓋文字、表格、PPT、PDF 四大辦公組件。這部分 AI 新能力集中在閱讀理解、問答、人機交互等方面。在 PPT 中,WPS AI 現(xiàn)已支持輸入主題,一鍵生成 PPT 演示文稿,并會根據(jù)用戶要求進行細化調(diào)節(jié),如更改主題風格、單頁美化、更改字體、更改配色、生成演講稿等等。
在 PDF 中,WPS 則展示了閱讀分析和理解能力。WPS AI 能夠閱讀包括論文、合同、課件等文檔,用戶以問答方式則可以獲得關鍵信息。并且,問答助手也會提供文檔溯源功能,確保用戶能夠得知信息來源。
用戶能夠通過手機等移動設備拍攝相關文檔,而后 WPS 給出相關翻譯、概括、分析等功能。
圖 1. WPS-AI 隨手拍與文檔問答

圖 2. WPS-AI 大綱生成
圖 3. WPS-AI PPT 美化
圖 4. WPS-AI PPT 生成
使用效果及影響
金山辦公圖像文檔識別與理解業(yè)務,通過采用 NVIDIA T4 Tensor Core GPU 及 TensorRT加速,相比于 CPU 其 pipleline 耗時共下降 84%;而采用 NVIDIA Triton 推理服務器部署,其部署成本節(jié)省了 23% 。
金山辦公 CV 團隊總監(jiān)熊龍飛表示:”我們有多個業(yè)務后邊的 AI 服務已經(jīng)通過采用該方案提高了速度和資源利用率,不僅給用戶端帶去了更高的速度響應,提高了用戶體驗,也為公司節(jié)約了大量的服務端 GPU 資源,收獲了更高的效益。我們在文檔識別與理解領域的應用案例也可以啟發(fā)到 OCR 和版式識別領域的其他公司和學者,相信隨著更多客戶通過采用 TensorRT 加速會給行業(yè)帶來很大的收益?!?/em>
*本文中圖片均來源于金山辦公,如果您有任何疑問或需要使用本文中的圖片,請聯(lián)系金山辦公。
點擊“閱讀原文”,或掃描下方海報二維碼,觀看 NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放,主題演講中文字幕版已上線,了解 AI、圖形及其他領域的最新進展!
原文標題:NVIDIA GPU 加速 WPS Office AI 服務,助力打造優(yōu)質(zhì)的用戶體驗
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
23文章
4112瀏覽量
99588
原文標題:NVIDIA GPU 加速 WPS Office AI 服務,助力打造優(yōu)質(zhì)的用戶體驗
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
NVIDIA向Kubernetes社區(qū)捐贈動態(tài)資源分配GPU驅(qū)動程序
Oracle和NVIDIA合作加速向量搜索和企業(yè)數(shù)據(jù)處理
NVIDIA加速計算平臺助力從地球到太空的AI應用
生命科學領先企業(yè)采用 NVIDIA BioNeMo 平臺加速 AI 驅(qū)動的藥物研發(fā)
NVIDIA RTX PRO 5000 Blackwell GPU的深度評測
NVIDIA RTX PRO 5000 72GB Blackwell GPU現(xiàn)已全面上市
利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發(fā)
NVIDIA RTX PRO 2000 Blackwell GPU性能測試
NVIDIA GPU 加速 WPS Office AI 服務,助力打造優(yōu)質(zhì)的用戶體驗
評論