哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Analytics Zoo: 統(tǒng)一的大數(shù)據(jù)分析+AI 平臺

MqC7_CAAI_1981 ? 來源:YXQ ? 2019-07-02 11:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

5月25日-26日,由中國人工智能學會主辦,南京市麒麟科技創(chuàng)新園管理委員會與京東云共同承辦的2019全球人工智能技術(shù)大會(2019 GAITC)在南京紫金山莊成功舉行。

在第一天的主論壇上,英特爾高級首席工程師、大數(shù)據(jù)技術(shù)全球 CTO戴金權(quán)發(fā)表了主題為《Analytics Zoo: 統(tǒng)一的大數(shù)據(jù)分析+AI 平臺》的精彩演講。

戴金權(quán)

英特爾高級首席工程師、大數(shù)據(jù)技術(shù)全球 CTO

以下是戴總的演講實錄:

在英特爾如何構(gòu)建統(tǒng)一的大數(shù)據(jù)分析+AI 平臺(我們稱為開源項目),幫助客戶更高效地開發(fā)大數(shù)據(jù)、大規(guī)模深度學習的應用。英特爾致力于提供端到端,從設(shè)備端到邊緣,再到數(shù)據(jù)中心云端完整的計算架構(gòu),比如在數(shù)據(jù)中心,今天英特爾志強服務(wù)器是 AI 應用分析的基礎(chǔ)架構(gòu),月提供了多種像神經(jīng)網(wǎng)絡(luò)處理器等豐富的硬件架構(gòu)。同樣在軟件上,我們也是致力于提供全站的解決方案,從最底層的核心算子開源項目可以幫助用戶更高效開發(fā)他們的計算庫;再到上層各種機器學習或者深度學習的框架,比如對開源的 Analytics Zoo,深度學習做了大量的優(yōu)化工作;再到最上層,也提供了一些開源工具包,目的是幫助應用開發(fā)人員更高效地開發(fā)基于深度學習的應用。

今天在這里著重分享的是基于大數(shù)據(jù)分析處理的框架上開發(fā)并且開源的兩個項目,一個是 BIGDL,是我們兩年半以前開源的一個深度學習的框架;在這個基礎(chǔ)上,去年又開源了 Analytics Zoo,構(gòu)建一個端到端的大數(shù)據(jù)分析 + 深度學習的平臺。為什么在英特爾開發(fā),并且開源基于大數(shù)據(jù)平臺上的大數(shù)據(jù)分析 +AI 的平臺工具?

下圖中黑色的小框代表機器學習或者深度學習的模型,它很關(guān)鍵,從某種意義上決定了硬件有怎樣的功能,做到怎樣的事情。但是會發(fā)現(xiàn),當想把這樣一個深度學習、機器學習模型應用到實際場景,從實驗室搬到現(xiàn)實工業(yè)級機器學習中,構(gòu)建這樣的端到端應用是非常復雜的,要有大量的其他模塊,比如怎樣收集數(shù)據(jù)、處理數(shù)據(jù)和驗證數(shù)據(jù),包括資源管理、集群監(jiān)控等。整個端到端的流水線是由一個非常多的模塊組成的,一個端到端大數(shù)據(jù)處理分析再加上深度學習、機器學習的流水線。

下圖是我們在兩年前和京東的一個合作。京東帶來的幾億張圖片,存儲在一個大規(guī)模分布式大數(shù)據(jù)集群里,我們做的事情是要對這些圖片——識別物品。比如,這張圖片上是一只鳥,然后提取特征。從深度學習、機器學習來說,不是特別復雜的應用,做物品識別、提取持證就可以了。但是事實上發(fā)現(xiàn),在對大規(guī)模的圖片讀取數(shù)據(jù),對圖片進行分布式處理,再進行模型推理;當識別物品時,對物品進行抽取,再進行處理,再提取特征等,把整個端到端流水線在大規(guī)模的圖片里是跑不好的。當要把這些機器學習、深度學習等技術(shù)應用到實際應用中,會有一個比較大的斷層,今天很多的科學家做了非常多的深度學習、機器學習的有效工作,但是如何將新技術(shù)、新創(chuàng)新應用到現(xiàn)實環(huán)境中,特別是在一些非常大規(guī)模、大數(shù)據(jù)生產(chǎn)系統(tǒng)中,從軟硬件架構(gòu)上有非常大的一個斷層。這就是為什么我們會去開源,像BIGDL,特別是 Analytics Zoo 平臺,能夠?qū)⒉煌哪K不管是用 TensorFlow 還是用Keras,將這些不同模塊的程序能夠無縫運行在端到端流水線上,大大提升開發(fā)效率。

總之,我們開發(fā)并且開源的目的是讓大家更加方便開發(fā)大數(shù)據(jù)、大規(guī)模深度學習的應用。通常很多用戶開始開發(fā)應用時,可能在一個筆記本上構(gòu)建一個簡單原形,當你覺得原形看還不錯時,希望可以跑歷史數(shù)據(jù),對過去幾個月或者幾年的數(shù)據(jù)進行一些驗證,為端到端的流水線構(gòu)造原形。在實驗上覺得效果還不錯,就希望部署到生產(chǎn)系統(tǒng)中,可能進行上線。同時也是大規(guī)模、大數(shù)據(jù)處理的流水線,可以讓你的程序運行在一個大標準集群里,直接利用現(xiàn)有的大數(shù)據(jù)集群、大數(shù)據(jù)計算資源運行你的程序,從而能夠提高你進行開發(fā)并且部署深度學習應用的效率。

有關(guān) Analytics Zoo 一些技術(shù)細節(jié)的構(gòu)成??偟膩碚f,構(gòu)建在很多不同底層計算的庫和框架上,在上面構(gòu)建一些豐富的流水線支持;再上面也提供了一些解決方案,包括預定模型。

下面來看一下具體的例子。有人和我說不要放太多代碼在里面,用 Spark 構(gòu)建一個 RDD,對大規(guī)模數(shù)據(jù)進行分布式處理。對各種各樣的數(shù)據(jù)源,不管是數(shù)據(jù)倉庫的方式,還是讀寫數(shù)據(jù)庫,或者是讀寫各種各樣的分布式文件系統(tǒng),可以直接使用 Spark Dataframe。下面的圖片是說,如能夠使用剛才訓練的模型,就可以使用我們的模型推理進行大規(guī)模分布式應用,在自己 Keras 等框架內(nèi)都很容易將我們深度學習模型集成在這些流水式處理或者在線處理中,而且在這個背后也可以透明地使用像 Analytics Zoo 的工具,對模型進行壓縮加速,包括至強深度學習加速指令對它進行加速;同時可以跑在大規(guī)模集群上進行分布式推理。

我們真正的用戶是怎么具體使用的?解決他們什么問題?下圖是我們和美的的合作,他們希望通過計算機視覺將其生產(chǎn)線生產(chǎn)出來的產(chǎn)品自動識別瑕疵、沒有貼標簽等。

工業(yè)機器人接上攝像機,對流水線出來的產(chǎn)品進行拍照,拿到照片后進行識別,產(chǎn)品上是不是有缺陷。比如,下圖中可以看到空調(diào)上少了一個螺絲。上圖中,粉紅色是對大規(guī)模圖片進行處理;黃色是 SSDLite這樣的一個模型,使用 Analytics Zoo API和 Spark 數(shù)據(jù)可以整合起來,在 Spark 上進行訓練。

下面這個例子是我們和微軟中國團隊的合作,他們希望給大家提供客戶。比如,他們有一個微信公眾號,在他們的微信公眾號上可以提問題,如怎么聯(lián)不上我的虛擬機、怎么重啟我的虛擬機、怎么開發(fā)票等。原來他們的做法是,在特定領(lǐng)域完成特定任務(wù)的對話。上午的報告中有很多專家提到,在垂直領(lǐng)域定義模版。他們有很多定義好的流程,可以隨著流程走?,F(xiàn)在很多人不隨著流程走,隨便問一些問題,怎么開不了發(fā)票?因為內(nèi)部有大量知識庫和準備好的問答,通過關(guān)鍵詞的匹配可以幫你去搜索,搜索出一些文章,希望滿足你的問題。這里,希望我們幫他做一些問答匹配,把相關(guān)的回答反饋給用戶,用戶看到這些問題后,可能解決了他的問題或者沒有;如果沒有解決,就要轉(zhuǎn)人工處理。轉(zhuǎn)人工處理是非常昂貴的事情,不同的問題要轉(zhuǎn)到不同的后臺,所以要有對意圖進行分類的模塊,將問題做一些分類,到底是財務(wù)的問題,還是網(wǎng)絡(luò)的問題,還是虛擬機的問題。

Office Depot,賣辦公用品的一個電商,做一些產(chǎn)品的推薦,當把一個物品加入到購物車后,根據(jù)你的行為推薦一些相關(guān)的物品。這是一個跑在云上的應用,使用 Spark 和 Analytics Zoo 上進行訓練,使用 mleap 就可以直接將 pipeline 模型保存下來,訓練出來的模型直接部署在 AWS S3,通過 BigDL 把它部署在一個 DNN 進行在線推理。

萬事達,希望給大家推送一些促銷信息,到哪里去購物,我給你一個立減等類似的優(yōu)惠,希望把這些推送到相關(guān)的客戶,客戶收到這些信息后會買東西。但是有一個特別的問題,我們會根據(jù)用戶過去購買行為進行分析,將用戶過去的購買行為、交易的數(shù)據(jù)是放在數(shù)據(jù)庫里的,怎樣能夠在Apache Hadoop 現(xiàn)有集群上運行這些新的深度學習應用?這時就可以使用 Analytics Zoo 深度學習框架,可以在現(xiàn)有大數(shù)據(jù)分析集群上,和其他的業(yè)務(wù)共享同一個集群,來運行這些新的深度學習應用。

CENR,歐洲的盒子研究中心,他們每天都在進行每秒大約 4 000 萬原子對撞,產(chǎn)生 1 TB 數(shù)據(jù),他們希望把這些數(shù)據(jù)存下來;希望有一個過濾機制,將有用的事件保留、存儲下來。這樣做可能每秒只存不超過 10 GB 的數(shù)據(jù),這些數(shù)據(jù)可以用于以后的分析。他們希望過濾的越準確越好,因此分為三種事件,構(gòu)建了一個深度學習模型,通過深度學習進行學習分類,將這些數(shù)據(jù)精確分析,用于以后的工作中。你可以很方便地在 Analytics Zoo 在單機上進行驗證,直接運行在一個分布式環(huán)境里進行訓練,最后訓練出結(jié)果。因為每秒都會產(chǎn)生 1 TB 數(shù)據(jù),所以需要一個在線的、類似于像流式處理的平臺,這里他們用了 Spark DataFrame 進行在線預測,對原子對撞事件進行分類。

怎么應用 Analytics Zoo ?比如在阿里云上面部署 EMR,使用 Analytics Zoo。

最后總結(jié)一下。我們之所以構(gòu)建Analytics Zoo 這樣的統(tǒng)計大數(shù)據(jù)分析 +AI平臺,就是希望能夠讓用戶在現(xiàn)實的生產(chǎn)環(huán)境中可以更方便構(gòu)架深度學習的應用,將各種不同的模塊、不同的框架下統(tǒng)一到一個端到端流水線上,大大提高客戶開發(fā)部署大數(shù)據(jù)分析和深度學習的能力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40982

    瀏覽量

    302533
  • 阿里云
    +關(guān)注

    關(guān)注

    3

    文章

    1046

    瀏覽量

    45859

原文標題:演講實錄丨戴金權(quán) Analytics Zoo: 統(tǒng)一的大數(shù)據(jù)分析+AI 平臺

文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI大數(shù)據(jù)驅(qū)動的半導體制造時代:面向分析就緒的 FDC 技術(shù)

    大數(shù)據(jù)分析與人工智能已成半導體制造核心技術(shù),行業(yè)核心挑戰(zhàn)并非數(shù)據(jù)采集,而是獲取可被大規(guī)模使用、分析并快速響應的就緒型數(shù)據(jù)。普迪飛JonHolt在2025年用戶大會提出:“如何應對
    的頭像 發(fā)表于 04-21 16:03 ?46次閱讀
    <b class='flag-5'>AI</b> 與<b class='flag-5'>大數(shù)據(jù)</b>驅(qū)動的半導體制造時代:面向<b class='flag-5'>分析</b>就緒的 FDC 技術(shù)

    AI賦能新型儲能 國內(nèi)首個數(shù)據(jù)分析平臺開啟行業(yè)智能新時代

    電子發(fā)燒友網(wǎng)綜合報道 近日,我國自主研發(fā)的首個新型儲能人工智能數(shù)據(jù)分析平臺正式投用,這技術(shù)成果落地標志著我國新型儲能行業(yè)從傳統(tǒng)人工運維邁入AI智能管理的全新階段,為新型儲能產(chǎn)業(yè)高質(zhì)量
    的頭像 發(fā)表于 04-13 07:45 ?5271次閱讀

    多項目監(jiān)測管理平臺 在線監(jiān)測數(shù)據(jù)分析

    數(shù)據(jù)分析
    穩(wěn)控自動化
    發(fā)布于 :2026年03月16日 14:37:33

    API數(shù)據(jù)分析:淘寶流量來源分析,渠道優(yōu)化!

    ? 在電商領(lǐng)域,流量來源分析是優(yōu)化營銷策略的核心。淘寶作為中國領(lǐng)先的電商平臺,其流量數(shù)據(jù)可通過API(應用程序接口)高效獲取和分析。本技術(shù)帖將逐步指導您如何利用淘寶API進行流量來源
    的頭像 發(fā)表于 01-23 13:42 ?369次閱讀
    API<b class='flag-5'>數(shù)據(jù)分析</b>:淘寶流量來源<b class='flag-5'>分析</b>,渠道優(yōu)化!

    利用拼多多用戶API進行粉絲數(shù)據(jù)分析,有效提升用戶粘性

    這些API進行粉絲數(shù)據(jù)分析,并基于分析結(jié)果制定增強用戶粘性的策略。 、 拼多多用戶API概覽 拼多多開放平臺提供了豐富的API接口,涵蓋商品、交易、用戶、物流等多個維度。對于粉絲
    的頭像 發(fā)表于 12-30 10:38 ?362次閱讀
    利用拼多多用戶API進行粉絲<b class='flag-5'>數(shù)據(jù)分析</b>,有效提升用戶粘性

    大數(shù)據(jù)平臺運營的基礎(chǔ)是什么

    ,值得每位企業(yè)運營者思考。 本文提供大數(shù)據(jù)平臺運營的三元素模型,旨在幫助企業(yè)管理層以全面的視角審視企業(yè)當前正在建設(shè)的大數(shù)據(jù)體系,真正地實現(xiàn)數(shù)據(jù)
    的頭像 發(fā)表于 12-23 16:07 ?333次閱讀

    經(jīng)營數(shù)據(jù)分析可以通過哪些方式

    在數(shù)聚股份看來,提起經(jīng)營數(shù)據(jù)分析,大家往往會聯(lián)想到些密密麻麻的數(shù)字表格,或是高級的數(shù)據(jù)建模手法,再或是華麗的數(shù)據(jù)報表。其實,“ 分析 ”本
    的頭像 發(fā)表于 12-05 16:31 ?723次閱讀

    【產(chǎn)品介紹】Altair RapidMiner數(shù)據(jù)分析與人工智能平臺

    AltairRapidMiner賦能組織解鎖數(shù)據(jù)洞察,運用數(shù)據(jù)分析和先進的人工智能自動化,提供可擴展的面向未來的解決方案。Altair數(shù)據(jù)分析和人工智能平臺包括
    的頭像 發(fā)表于 09-18 17:56 ?1021次閱讀
    【產(chǎn)品介紹】Altair RapidMiner<b class='flag-5'>數(shù)據(jù)分析</b>與人工智能<b class='flag-5'>平臺</b>

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)

    數(shù)據(jù),結(jié)合大數(shù)據(jù)分析、流程自動化及云邊協(xié)同技術(shù),實現(xiàn)電磁環(huán)境全生命周期管理。以下從五大維度精簡解析: 應用案例 北京華盛恒輝、北京五木恒潤研發(fā)的 EMC/EMI 智能管理系統(tǒng)已落地應用,成效顯著,為系統(tǒng)推廣提供有力支撐。 、
    的頭像 發(fā)表于 09-17 14:58 ?754次閱讀

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理平臺

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)
    的頭像 發(fā)表于 09-17 14:58 ?713次閱讀
    電磁兼容與電磁干擾在電磁兼容性<b class='flag-5'>大數(shù)據(jù)分析</b>中的智能管理<b class='flag-5'>平臺</b>

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)

    電磁兼容與電磁干擾在電磁兼容性大數(shù)據(jù)分析中的智能管理系統(tǒng)
    的頭像 發(fā)表于 09-17 14:42 ?1034次閱讀
    電磁兼容與電磁干擾在電磁兼容性<b class='flag-5'>大數(shù)據(jù)分析</b>中的智能管理系統(tǒng)

    普迪飛 Exensio?數(shù)據(jù)分析平臺 | Test Operations解鎖半導體測試新紀元

    TestOperations是Exensio數(shù)據(jù)分析平臺的四個主要模塊之。T-Ops模塊旨在幫助集成器件制造商(IDM)、無晶圓廠半導體公司(Fabless)和外包半導體(產(chǎn)品)封測廠(OSAT
    的頭像 發(fā)表于 08-19 13:53 ?1623次閱讀
    普迪飛 Exensio?<b class='flag-5'>數(shù)據(jù)分析</b><b class='flag-5'>平臺</b> | Test Operations解鎖半導體測試新紀元

    AI數(shù)據(jù)分析儀設(shè)計原理圖:RapidIO信號接入 平板AI數(shù)據(jù)分析

    AI數(shù)據(jù)分析儀, 平板數(shù)據(jù)分析儀, 數(shù)據(jù)分析儀, AI邊緣計算, 高帶寬數(shù)據(jù)輸入
    的頭像 發(fā)表于 07-17 09:20 ?856次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)分析</b>儀設(shè)計原理圖:RapidIO信號接入 平板<b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)分析</b>儀

    智能裝備物聯(lián)網(wǎng)遠程管理平臺是什么?有什么功能?

    預警、遠程維護、數(shù)據(jù)分析與決策支持等功能,幫助企業(yè)提高設(shè)備運行效率、降低運維成本并提升整體生產(chǎn)管理水平。 平臺核心功能詳解 設(shè)備接入與統(tǒng)一管理 多協(xié)議兼容 :支持Modbus、OPC UA、MQTT等300+工業(yè)協(xié)議,可接入超聲
    的頭像 發(fā)表于 07-10 15:03 ?2017次閱讀

    請問STM32N657如何使用官方提供的model zoo services中的HEX文件?

    調(diào)試中遇到個問題,希望各位專家解惑。 請問上述問題如何解決?或者如何可以正常的加載model zoo service中的AI應用程序? 感謝!
    發(fā)表于 06-17 06:44
    确山县| 庆元县| 武宣县| 桃园县| 沁源县| 张家川| 洪雅县| 开封县| 沙河市| 元朗区| 万盛区| 平潭县| 阿图什市| 永昌县| 潮州市| 永嘉县| 鄂托克前旗| 筠连县| 常熟市| 青河县| 阳新县| 定襄县| 德保县| 和林格尔县| 泾阳县| 即墨市| 城固县| 颍上县| 贵南县| 宁国市| 沐川县| 黑河市| 黔江区| 广宗县| 大冶市| 腾冲县| 襄汾县| 老河口市| 广平县| 尉氏县| 罗甸县|