近日,Nature刊載IBM新研究,使用光學器件打造的“全光學”深度神經(jīng)網(wǎng)絡可以比傳統(tǒng)計算方式的能效更高,同時具備可擴展性、無需光電轉(zhuǎn)換和高帶寬等優(yōu)勢。這一發(fā)現(xiàn)可能給未來光學神經(jīng)網(wǎng)絡加速器的出現(xiàn)打下基礎。
光纖能夠以光的形式在世界范圍內(nèi)傳輸數(shù)據(jù),成為現(xiàn)代電信技術(shù)的支柱。不過如果需要分析這些傳輸數(shù)據(jù),要將其從光信號轉(zhuǎn)換為電子信號,然后用電子設備進行處理。曾經(jīng)有一段時間,光學被認為是未來最具潛力的計算技術(shù)的基礎,但與電子計算機的快速進步相比,光學計算技術(shù)的競爭力明顯不足。
不過,在過去幾年中,業(yè)界越來越關注對計算能源的成本問題。因此,光學計算系統(tǒng)再次受到關注。光學計算的能耗低,又能作為AI算法(如深度神經(jīng)網(wǎng)絡(DNN))的專用加速硬件。 近日,F(xiàn)eldmann等人在《自然》期刊上發(fā)表了這種“全光學網(wǎng)絡實現(xiàn)”的最新進展。
深度神經(jīng)網(wǎng)絡包括多層人工神經(jīng)元和人工突觸。這些連接的強度稱為網(wǎng)絡權(quán)重,可以是陽性,表示神經(jīng)元的興奮,或陰性,表示神經(jīng)元的抑制。網(wǎng)絡會盡力將實際輸出和期望輸出之間的差異實現(xiàn)最小化,從而改變突觸的權(quán)重,來執(zhí)行圖像識別等任務。
CPU和其他硬件加速器通常用于DNN的計算。DNN的訓練可以使用已知數(shù)據(jù)集,而經(jīng)過訓練后的DNN可以用來推理任務中的未知數(shù)據(jù)。雖然計算量很大,但計算操作的多樣性不會很高,因為“乘法累加”操作在許多突觸權(quán)重和神經(jīng)元激勵中占主導地位。
DNN在計算精度較低時仍能正常工作。因此,DNN網(wǎng)絡代表了非傳統(tǒng)計算技術(shù)的潛在機會。研究人員正在努力打造基于新型非易失性存儲器件的DNN加速器。這類設備在切斷電源時也能保存信息,通過模擬電子計算提升DNN的速度和能效。
那么,為什么不考慮使用光學器件呢?導光部件中可以包含大量數(shù)據(jù) - 無論是用于電信的光纖還是用于光子芯片上的波導。在這種波導內(nèi)部,可以使用“波分復用”技術(shù),讓許多不同波長的光一起傳播。然后可以以與電子到光學調(diào)制和光電子檢測相關的可用帶寬限制的速率調(diào)制(以可以攜帶信息的方式改變)每個波長。

圖1全光學脈沖神經(jīng)元回路
使用諧振器可以實現(xiàn)單個波長的添加或移除,就像對貨車的裝貨和卸貨一樣。使用微米級環(huán)形諧振器可以構(gòu)建DNN網(wǎng)絡突觸權(quán)重陣列。這種諧振器可以采用熱調(diào)制,電光調(diào)制,或通過相變材料調(diào)制。這些材料可以在非晶相和結(jié)晶相之間切換,不同的材料的吸光能力差別很大。在理想條件下,進行乘法累加運算的功耗很低。
Feldmann研究團隊在毫米級光子芯片上實現(xiàn)了“全光學神經(jīng)網(wǎng)絡”,其中網(wǎng)絡內(nèi)沒有使用光電轉(zhuǎn)換。輸入的數(shù)據(jù)被電子調(diào)制到不同的波長上注入網(wǎng)絡,但此后所有數(shù)據(jù)都保留在芯片上。利用集成相變材料實現(xiàn)突觸權(quán)重的調(diào)節(jié)和神經(jīng)元的集成。

圖2人工神經(jīng)元的脈沖生成與操作
本文作者小規(guī)模地展示了有監(jiān)督和無監(jiān)督的學習 - 即使用標記數(shù)據(jù)實現(xiàn)訓練(DNN學習的方式),以及使用未標記的數(shù)據(jù)訓練(類似人類的學習方式)。

圖3基于相變?nèi)鈱W神經(jīng)元系統(tǒng)實現(xiàn)監(jiān)督學習和非監(jiān)督學習
因為權(quán)重表達是通過光的吸收實現(xiàn)的,所以負權(quán)重需要更大的偏置信號,該信號不能激活相變材料。一種替代方法是使用Mach-Zehnder干涉儀的裝置,將單個波導分成兩個臂,然后重新組合,這時的透射光量取決于兩個傳播路徑之間光學相位的差異。然而,要想將這種方法與波分復用相結(jié)合可能難度較大,因為每個干涉儀的臂需要為每個波長引入適當?shù)南辔徊睢?/p>
全光學實現(xiàn)的DNN仍然存在重大挑戰(zhàn)。在理想情況下,它們的總功率使用率可能較低,經(jīng)常需要熱光功率來調(diào)節(jié)和維持每個Mach-Zehnder干涉儀臂中的光學相位差異。

圖4全光學神經(jīng)網(wǎng)絡的可擴展架構(gòu)
此外,對注入含有相變材料的系統(tǒng)的總光功率必須仔細校準,以使材料對輸入信號的響應符合預期。盡管相變材料也可以用于調(diào)整Mach-Zehnder相位,但是材料吸收光的強度和減慢光速之間會出現(xiàn)不可避免的交叉耦合,這會增加系統(tǒng)的復雜性。
傳統(tǒng)的DNN規(guī)模已經(jīng)發(fā)展到很大,可能包含數(shù)千個神經(jīng)元和數(shù)百萬個突觸。但是光子網(wǎng)絡的波導需要彼此間隔很遠才能防止耦合,并且避免急劇彎曲以防止光離開波導。因為兩個波導的交叉可能會將不需要的功率注入錯誤路徑,這對光子芯片設計的2D特性造成了實質(zhì)性的限制。

圖5單層脈沖神經(jīng)網(wǎng)絡的實驗實現(xiàn)
實現(xiàn)光學器件打造神經(jīng)網(wǎng)絡需要很長的距離和很大的面積,但是每個光學結(jié)構(gòu)的關鍵部分的制造需要高精度。這是因為波導和耦合區(qū)域,比如在每個微環(huán)諧振器的入口和出口處,必須達到相應網(wǎng)絡性能所需的精確尺寸。對于如何制造小型微環(huán)諧振器也存在諸多限制。
最后,調(diào)制技術(shù)提供的光學效應較弱,需要很長的相互作用區(qū)域,以使其對通過的光的有限影響能夠達到顯著水平。
Feldmann 團隊的研究中所取得的進步,有望推動該領域的未來發(fā)展,該研究可能會為未來高能效、可擴展的光學神經(jīng)網(wǎng)絡加速器的出現(xiàn)打下基礎。
-
神經(jīng)網(wǎng)絡
+關注
關注
42文章
4840瀏覽量
108091 -
光學器件
+關注
關注
1文章
152瀏覽量
12432
原文標題:Nature最新:下一代計算架構(gòu)革命,從“全光學神經(jīng)網(wǎng)絡”開始
文章出處:【微信號:aicapital,微信公眾號:全球人工智能】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
神經(jīng)網(wǎng)絡解決方案讓自動駕駛成為現(xiàn)實
【PYNQ-Z2試用體驗】神經(jīng)網(wǎng)絡基礎知識
全連接神經(jīng)網(wǎng)絡和卷積神經(jīng)網(wǎng)絡有什么區(qū)別
【案例分享】ART神經(jīng)網(wǎng)絡與SOM神經(jīng)網(wǎng)絡
為什么說射頻前端的一體化設計決定下一代移動設備?
如何構(gòu)建神經(jīng)網(wǎng)絡?
可分離卷積神經(jīng)網(wǎng)絡在 Cortex-M 處理器上實現(xiàn)關鍵詞識別
卷積神經(jīng)網(wǎng)絡模型發(fā)展及應用
基于Imagination革命性的NNA架構(gòu)PowerVRSeries2NX設計的神經(jīng)網(wǎng)絡內(nèi)核詳解
Nature下一代計算架構(gòu)革命 從全光學神經(jīng)網(wǎng)絡開始
評論