哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

光子AI芯片算法先行硬件跟進(jìn),為傳統(tǒng)加速計(jì)算卡裝上“渦輪增壓”

工程師鄧生 ? 來(lái)源:芯東西 ? 作者:白冰 ? 2020-12-23 16:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在日前舉辦的GTIC 2020上,光子算數(shù)創(chuàng)始人兼CEO白冰發(fā)表了一場(chǎng)題為《AI芯片的另一條路:光子芯片》的主題演講。作為一家國(guó)內(nèi)少有的光子AI芯片賽道玩家,白冰在演講中與大家分享了光學(xué)芯片的工程化進(jìn)展、市場(chǎng)定位及目標(biāo)客戶、具體研發(fā)實(shí)施路徑及相關(guān)適配算法等話題。

一、光學(xué)芯片工程化進(jìn)展,已至測(cè)試階段

與常規(guī)數(shù)字芯片不同,白冰所創(chuàng)立的光子算數(shù),采取了另外一條技術(shù)路線——光子芯片。

白冰說(shuō),用光學(xué)做計(jì)算處于比較早期的階段。目前光子算數(shù)團(tuán)隊(duì)已將其做成測(cè)試級(jí)的產(chǎn)品,并于今年放至服務(wù)器廠商客戶處進(jìn)行測(cè)試。

作為一家初創(chuàng)公司,光子算數(shù)和高校、研究所等幾家單位共同工作。其早期樣片集成了幾百個(gè)不同的光學(xué)單元,比如有電光轉(zhuǎn)換,把電信號(hào)加載到光載波,然后通過(guò)傳播到片內(nèi)的光學(xué)組合,完成一些特定的函數(shù)變換。跟傳統(tǒng)的計(jì)算特征不同,它不是面向加減乘除,而是直接完成一個(gè)復(fù)雜的變化過(guò)程。

這被稱為可編程光子陣列芯片F(xiàn)PPGA(Field Programmable Photonic Gate Arrays),其中的光學(xué)單元可以通過(guò)電控,控制重新的連接組合方式,實(shí)現(xiàn)不同的復(fù)雜函數(shù)。也就是說(shuō),F(xiàn)PPGA具有可重構(gòu)的特性。

光學(xué)芯片加速的不是完整算法,和所有的數(shù)字芯片一樣,光學(xué)芯片面向復(fù)雜函數(shù)做加速計(jì)算,其計(jì)算對(duì)象是特定算子。光的劣勢(shì)在于不是特別靈活,但是在某些函數(shù)上有優(yōu)勢(shì)。

整個(gè)系統(tǒng)是光電混合的,數(shù)據(jù)在光電兩部分中完成一個(gè)流動(dòng),執(zhí)行一個(gè)完整的計(jì)算過(guò)程,由光學(xué)、電學(xué)芯片構(gòu)成光電混合AI計(jì)算硬件系統(tǒng)。

光電混合系統(tǒng)仍要做到軟硬協(xié)同,開(kāi)發(fā)適合光學(xué)加速的算法,使得光電混合系統(tǒng)的硬件物理架構(gòu)與算法的運(yùn)算/訪存特征相匹配。

從技術(shù)架構(gòu)圖可以看到,左邊是電學(xué)部分,包含邏輯控制、緩存等,以及專用的定制化IP。考慮到與光學(xué)芯片匹配,這些IP與傳統(tǒng)的數(shù)字IP不一樣,需要定制化開(kāi)發(fā);右邊是光學(xué)模組,除了光學(xué)計(jì)算芯片外,還有一顆DFB激光器芯片,還有驅(qū)動(dòng)、TIA以及小型的控制、電源芯片等組件。

中間采用熱插拔的方式,跟通信模塊一樣。之所以選擇這一方式,是因?yàn)楣庾铀銛?shù)團(tuán)隊(duì)考慮到光芯片、電芯片放到一起,可能賣(mài)不出去,因?yàn)楹茈y拼得過(guò)GPU,考慮到其產(chǎn)品定位,因此做成插拔型。

光子算數(shù)與高校一起打造了面向服務(wù)器的光電混合AI加速計(jì)算卡,目前已完成一些定制化加速任務(wù),包括機(jī)器學(xué)習(xí)推理、時(shí)間序列分析等特定任務(wù)。白冰說(shuō),計(jì)算卡現(xiàn)在的性能可用,不過(guò)還比較初步,能做到36路1080P視頻同步處理,功耗不到70W,算力資源相對(duì)有限,混合精度下峰值算力接近20TOPS,光部分為低精度,電部分為高精度

計(jì)算卡封裝有光子協(xié)處理引擎模塊,散熱器、驅(qū)動(dòng)、控制器、TIA、一些計(jì)算控制部分和賽靈思FPGA芯片,數(shù)據(jù)在光電之間形成循環(huán)流動(dòng)。光的定位是為電做協(xié)處理加速。

其中光子協(xié)處理引擎模塊用的是兩個(gè)QSFP28的光通信接口(每個(gè)都是100GB/s),光通信物理接口非常成熟,其光學(xué)帶寬大約達(dá)200GB/s,典型功耗達(dá)7W,算力在1.2TOPS左右。該模塊支持熱插拔,不需要經(jīng)過(guò)預(yù)調(diào),內(nèi)部封裝了一些適合于用光學(xué)做的特殊的算子函數(shù),比如隨機(jī)投影、高維空間變換映射、壓縮、小規(guī)模卷積、時(shí)間序列等高算子?,F(xiàn)在該模塊還比較初步,下一階段,光子算數(shù)會(huì)進(jìn)一步擴(kuò)大其規(guī)模。

光子協(xié)處理引擎模塊里面是兩層結(jié)構(gòu),上面是控制模組,其二級(jí)控制緩存處理隨時(shí)可以換,以適應(yīng)下一步軟件迭代;下面是光學(xué)運(yùn)算模組,包含整個(gè)光學(xué)計(jì)算部分,其中集成了大量的光學(xué)單元,為了一些特定的函數(shù),可以做低延時(shí)、低能耗的變換過(guò)程。

完整計(jì)算過(guò)程是FPGA接收的數(shù)據(jù)從電接口進(jìn)來(lái),經(jīng)過(guò)驅(qū)動(dòng)放大,驅(qū)動(dòng)光芯片上的調(diào)優(yōu)器,把信號(hào)再返到光上,經(jīng)過(guò)片內(nèi)傳輸完成變換,然后再變成電信號(hào)返回。

目前光子算數(shù)已將一些光電混合AI加速計(jì)算服務(wù)器提供給機(jī)房和IDC試用與測(cè)試,接口是標(biāo)準(zhǔn)的PCIe口。此外,其服務(wù)器也與一些國(guó)產(chǎn)操作系統(tǒng)CPU廠商做了適配。

白冰坦言,該服務(wù)器目前性能仍較有限,70W運(yùn)行功耗下,大概能做三四十路的視頻同步處理,跟純電比沒(méi)有那么強(qiáng)。

下一步,他們考慮將光的部分帶寬擴(kuò)大,進(jìn)一步提升算力。當(dāng)前在光通信領(lǐng)域,100GB/s是主流,200GB/s比較少,400GB/s、800GB/s主要有一些大廠在做,目前還沒(méi)推出產(chǎn)品。盡管做這塊成本較高,但這是比較切實(shí)可行的已有方案。

二、熱插拔式模塊,可由大廠軟件調(diào)用

白冰談到的第二個(gè)話題,光學(xué)芯片的產(chǎn)品定位,即這個(gè)東西做完之后,賣(mài)給誰(shuí)?

如果想在云端替代NVIDIA GPU,是非常困難的,其核心競(jìng)爭(zhēng)力在于它的軟件工具。把電和光放到一張卡上,要開(kāi)發(fā)完整的軟件套件,工作量非常大且代價(jià)很高。當(dāng)然云端加速計(jì)算卡也可以做定制化,但定制化在云端的適用空間會(huì)相對(duì)有限,這是做云端AI芯片的所有公司共同面臨的窘境。

光子算數(shù)為什么選擇做成熱插拔方式?實(shí)際上,這是將適合用光學(xué)做的特定算子封裝到光學(xué)模塊里,通過(guò)熱插拔接口和國(guó)內(nèi)大廠的加速計(jì)算卡插在一起,這種接口制都是成熟的,開(kāi)發(fā)者使用大廠的軟件工具,即可通過(guò)API調(diào)用光子算數(shù)的模塊內(nèi)嵌特定算子。面向具體應(yīng)用,開(kāi)發(fā)者通過(guò)大廠軟件工具,開(kāi)發(fā)由光子算數(shù)的光學(xué)算子與大廠原有的電學(xué)算子組成的光電混合算法整體。

光子算數(shù)對(duì)自己的市場(chǎng)定位是提供傳統(tǒng)加速計(jì)算卡的升級(jí)組件,使傳統(tǒng)加速計(jì)算卡提升性能、降低能耗、降低成本,不受制于軟件工具。消費(fèi)者依然買(mǎi)大廠的卡和工具,如需升級(jí),即可選用光子算數(shù)的模塊。白冰提了一個(gè)形象的比喻,用一張傳統(tǒng)卡加上光子協(xié)處理引擎模塊的效果,相當(dāng)于給汽車(chē)配了一個(gè)渦輪增壓。

三、研發(fā)實(shí)施路徑:算法先行,硬件跟進(jìn)

白冰談到關(guān)于研發(fā)路線。他們研發(fā)的內(nèi)容是系統(tǒng)性工程,相較于設(shè)計(jì)新型的光學(xué)計(jì)算單元,難度是可以克服的。

更多的,其行業(yè)特征特別像光模塊,它的行業(yè)拓展是小芯片、大組裝,其封裝和組裝成本占整個(gè)的70%,是一個(gè)系統(tǒng)工程。更主要的,要做軟硬系統(tǒng)的匹配,同時(shí)硬件要做到光與電的協(xié)同,其中包括一些算子、標(biāo)定的東西并涉及到一些關(guān)鍵技術(shù)。

最核心的,要做適合光學(xué)做的算法,算法先行,硬件跟進(jìn)。目前市面上的傳統(tǒng)算法不太適合光學(xué)芯片去執(zhí)行,計(jì)算機(jī)發(fā)展這么多年,一直是軟和硬耦合在一起發(fā)展,“硬”一直是數(shù)字芯片,所以算法里嵌了很多數(shù)字芯片的基因,用光學(xué)硬件很難加速。

因此首先要開(kāi)發(fā)適合光學(xué)做的算子,給光學(xué)算子配一些數(shù)字算子,去組成完整的算法,然后來(lái)分析光電混合算法的運(yùn)算和訪存特征,再之后再設(shè)計(jì)硬件,如何給算法加速。

“這是我們做的核心關(guān)鍵思路,這也是為什么很多公司目前做不出來(lái)的原因?!卑妆f(shuō)。

四、適配光學(xué)計(jì)算的算法示例

那么,哪些算法適合用光學(xué)計(jì)算去處理呢?

白冰舉了些例子,比如光學(xué)隨機(jī)投影,用光學(xué)芯片物理實(shí)現(xiàn)無(wú)需復(fù)雜精確控制,加工容差大、一致性要求低。該方案有循環(huán)的效果,不是卷積,而是對(duì)數(shù)據(jù)直接進(jìn)行維度的變化,直接能做非線性的處理,比如升維或壓縮這樣。

例如對(duì)平面上的目標(biāo)進(jìn)行分類(lèi),用一條曲線可以把它分開(kāi),曲線是比較復(fù)雜的,算法里面可能對(duì)應(yīng)很多層,在處理之前,可以將數(shù)據(jù)扔到光學(xué)芯片里,做一個(gè)升維操作,數(shù)據(jù)從二維空間變到三維、四維空間,多了Z軸。這個(gè)投影用光學(xué)做的話沒(méi)有代價(jià),在電里面用一個(gè)線性的平面就可以把兩類(lèi)目標(biāo)區(qū)隔開(kāi),可以把十層的網(wǎng)絡(luò)壓縮到兩層,這樣就是投影變換,光學(xué)芯片會(huì)有內(nèi)部的架構(gòu)。

光子算數(shù)把光學(xué)函數(shù)和數(shù)字算子組成了關(guān)鍵的光電混合算法,經(jīng)嘗試,至少可以跟市面上主流的算法做更新。

比如基于光學(xué)隨機(jī)投影做目標(biāo)識(shí)別遷移學(xué)習(xí)時(shí),后半部分進(jìn)行重新訓(xùn)練,算法訓(xùn)練量還是很大的。其實(shí)可以不走綠色部分,直接在藍(lán)色塊用光學(xué)芯片做預(yù)處理,后面加簡(jiǎn)單的線性層,就可以完成任務(wù),做一個(gè)維度的升維變化。

再比如訓(xùn)練時(shí),通常會(huì)用BP,連續(xù)求導(dǎo)會(huì)有梯度消失或爆炸的問(wèn)題,另外訓(xùn)練量也比較大。用光學(xué)做,可以直接將輸出層Loss通過(guò)光學(xué)隨機(jī)投影直接回傳到不同的權(quán)重層,每層并行獨(dú)立更新權(quán)重,這樣可以做并行訓(xùn)練處理并且避免了連續(xù)求導(dǎo)的過(guò)程。

盡管這一領(lǐng)域相對(duì)早期的,主要面向特定化的市場(chǎng),但可以看到,它已在某些領(lǐng)域有些成熟化的產(chǎn)品出現(xiàn)和得到應(yīng)用。由于當(dāng)前光學(xué)芯片主要作為協(xié)處理器,光子算數(shù)也在持續(xù)地與做電學(xué)芯片的大廠積極溝通合作。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 計(jì)算
    +關(guān)注

    關(guān)注

    2

    文章

    460

    瀏覽量

    40125
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41101

    瀏覽量

    302576
  • 光子芯片
    +關(guān)注

    關(guān)注

    3

    文章

    110

    瀏覽量

    25298
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    2026 渦輪增壓執(zhí)行器角度霍爾傳感器IC方案|實(shí)現(xiàn)高精度傳感與高效控制

    霍爾芯片,打造雙路線角度傳感方案,GPA提供從量產(chǎn)到前瞻的全新國(guó)產(chǎn)化支撐。 一、機(jī)械增壓與廢氣渦輪增壓核心對(duì)比 機(jī)械
    的頭像 發(fā)表于 04-23 13:22 ?12次閱讀

    FPGA硬件加速卡設(shè)計(jì)原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高, XCKU115, 光纖采集, 信號(hào)計(jì)算板, 硬件加速卡
    的頭像 發(fā)表于 02-12 09:52 ?544次閱讀
    FPGA<b class='flag-5'>硬件加速卡</b>設(shè)計(jì)原理圖:1-基于Xilinx XCKU115的半高PCIe x8 <b class='flag-5'>硬件加速卡</b> PCIe半高 XCKU115-3-FLVF1924-E<b class='flag-5'>芯片</b>

    RSoft GPU加速技術(shù)重塑光子元件設(shè)計(jì)效率革命

    在現(xiàn)代光子元件設(shè)計(jì)中,有限時(shí)域差分法(FDTD)是進(jìn)行電磁模擬分析的重要基礎(chǔ)技術(shù)。然而,隨著結(jié)構(gòu)尺寸的縮小和模擬范圍的擴(kuò)大,傳統(tǒng)的 CPU 計(jì)算 可能需要數(shù)天甚至數(shù)周才能完成一次完整的模擬,嚴(yán)重影響
    的頭像 發(fā)表于 01-12 14:09 ?410次閱讀
    RSoft GPU<b class='flag-5'>加速</b>技術(shù)重塑<b class='flag-5'>光子</b>元件設(shè)計(jì)效率革命

    邊緣計(jì)算中的AI加速器類(lèi)型與應(yīng)用

    人工智能正在推動(dòng)對(duì)更快速、更智能、更高效計(jì)算的需求。然而,隨著每秒產(chǎn)生海量數(shù)據(jù),將所有數(shù)據(jù)發(fā)送至云端處理已變得不切實(shí)際。這正是邊緣計(jì)算AI加速器變得不可或缺的原因。這種專用
    的頭像 發(fā)表于 11-06 13:42 ?993次閱讀
    邊緣<b class='flag-5'>計(jì)算</b>中的<b class='flag-5'>AI</b><b class='flag-5'>加速</b>器類(lèi)型與應(yīng)用

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    實(shí)例,從而保持高計(jì)算效率。 2、Q算法 Q項(xiàng)目將大模型功能與A*和Q-learning等復(fù)雜算法結(jié)合,進(jìn)一步推動(dòng)了AI領(lǐng)域的蓬勃發(fā)展,標(biāo)志著向AGI方向邁出了重要的一步。 可能達(dá)到的高
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+神經(jīng)形態(tài)計(jì)算、類(lèi)腦芯片

    AI芯片不僅包括深度學(xué)細(xì)AI加速器,還有另外一個(gè)主要列別:類(lèi)腦芯片。類(lèi)腦芯片是模擬人腦神經(jīng)網(wǎng)絡(luò)架
    發(fā)表于 09-17 16:43

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的未來(lái):提升算力還是智力

    持續(xù)發(fā)展體現(xiàn)在: 1、收益遞減 大模型的基礎(chǔ)的需要極大的算力,這首先源于昂貴的高性能AI芯片,然后是寶貴的電力、水等與環(huán)境相關(guān)的資源。 收益遞減體現(xiàn)在: ①模型大小 ②訓(xùn)練數(shù)據(jù)量 ③訓(xùn)練算法的優(yōu)化 2
    發(fā)表于 09-14 14:04

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+第二章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    算法 5.2加速矩陣乘法的芯片架構(gòu) ①新的矩陣乘法器架構(gòu) ②基于RISC-V的矩陣乘法擴(kuò)展指令集 ③用信息論的思想來(lái)減少AI推理計(jì)算量 三、
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    ②Transformer引擎③NVLink Switch系統(tǒng)④機(jī)密計(jì)算⑤HBM FPGA: 架構(gòu)的主要特點(diǎn):可重構(gòu)邏輯和路由,可以快速實(shí)現(xiàn)各種不同形式的神經(jīng)網(wǎng)絡(luò)加速。 ASIC: 介紹了幾種ASIC AI
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件AI濕件

    想到,除了研究大腦的抽象數(shù)學(xué)模型外,能否拋棄傳統(tǒng)芯片實(shí)現(xiàn)方式,以化學(xué)物質(zhì)和生物組件、材料及相關(guān)現(xiàn)象來(lái)構(gòu)建人工神經(jīng)網(wǎng)絡(luò)或提取其功能來(lái)用于AI處理,甚至直接用生物體來(lái)實(shí)現(xiàn)AI功能,這就是
    發(fā)表于 09-06 19:12

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    提升AI智力 第4章 AI芯片:匯聚半導(dǎo)體芯片產(chǎn)業(yè)前沿技術(shù) 第5章 從AI硬件
    發(fā)表于 09-05 15:10

    突破傳統(tǒng)桎梏,PPEC Workbench 開(kāi)啟電源智能化設(shè)計(jì)新路徑

    創(chuàng)新與性能突破,而非重復(fù)性底層開(kāi)發(fā)。 ▌AI智能體輔助開(kāi)發(fā): 打造專注電源領(lǐng)域設(shè)計(jì)開(kāi)發(fā)的 AI 智能助手,工程師在提供專業(yè)支持。 ▌行業(yè)資源整合協(xié)同: 連接開(kāi)發(fā)者與芯片、器件廠,實(shí)現(xiàn)
    發(fā)表于 08-26 11:40

    AI 芯片浪潮下,職場(chǎng)晉升新契機(jī)?

    芯片設(shè)計(jì)例,從最初的架構(gòu)選型,到算法適配、性能優(yōu)化,每個(gè)環(huán)節(jié)都考驗(yàn)著工程師的專業(yè)素養(yǎng)。在設(shè)計(jì)一款面向智能安防領(lǐng)域的 AI 芯片時(shí),需要深
    發(fā)表于 08-19 08:58

    【書(shū)籍評(píng)測(cè)活動(dòng)NO.64】AI芯片,從過(guò)去走向未來(lái):《AI芯片:科技探索與AGI愿景》

    計(jì)算等類(lèi)別AI芯片的及時(shí)、全面而富有遠(yuǎn)見(jiàn)的書(shū)?!?那么時(shí)至今日,這個(gè)世界發(fā)生了什么變化呢? 在這四年間,最重大的技術(shù)變革無(wú)疑就是大模型的橫空出世,人類(lèi)的時(shí)間仿佛被裝上
    發(fā)表于 07-28 13:54

    AI芯片加速人工智能計(jì)算的專用硬件引擎

    人工智能(AI)的快速發(fā)展離不開(kāi)高性能計(jì)算硬件的支持,而傳統(tǒng)CPU由于架構(gòu)限制,難以高效處理AI任務(wù)中的大規(guī)模并行
    的頭像 發(fā)表于 07-09 15:59 ?1959次閱讀
    新闻| 依安县| 沾化县| 莒南县| 建湖县| 保定市| 西安市| 桃源县| 静安区| 大埔区| 江陵县| 平顺县| 梁平县| 辽阳市| 贵州省| 卢湾区| 砚山县| 平和县| 淳化县| 淳安县| 巴南区| 乌拉特前旗| 洞头县| 武定县| 镇赉县| 澄迈县| 沧源| 宣恩县| 图片| 桐城市| 延边| 安徽省| 临夏市| 长海县| 那曲县| 平谷区| 含山县| 江达县| 塔城市| 土默特左旗| 邹城市|