哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

繞開CPU和內存,你瀏覽的內容或來自SSD的推薦

E4Life ? 來源:電子發(fā)燒友原創(chuàng) ? 作者:Leland ? 2021-11-24 09:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

繞開CPU和內存,你瀏覽的內容或來自SSD的推薦

相信不少人都還記得今年AI芯片公司Esperanto發(fā)布的千核RISC-V處理器ET-SoC-1,隨著這款7nm的芯片于第二季度成功流片返回后,Esperanto得以在芯片上運行代碼,以及嘗試新的應用方向,其中之一就是AI-SSD。在近期舉辦的三星Foundry活動上,Esperanto公開了自己AI-SSD的概念模型。

個性化推薦系統(tǒng)的挑戰(zhàn)

在我們刷短視頻、聽歌和瀏覽社交網絡時,一部分內容來自于我們已經關注的用戶,但絕大多數來自于推薦系統(tǒng)的推送。推薦系統(tǒng)的準確程度很大程度決定了軟件的用戶體驗,也是如今互聯(lián)網經濟系統(tǒng)的命脈。但這類推薦也往往是服務器上消耗最大的AI處理負載,優(yōu)化推薦系統(tǒng)可以提高推薦系統(tǒng)的速度,減少在服務器上的成本。

DLRM深度學習推薦模型 / Meta

談到推薦系統(tǒng)就不得不談到嵌入,嵌入是當下推薦系統(tǒng)中關鍵的組成部分。盡管每家都有著不同的推薦模型,但或多或少都是采用查找嵌入表的方法來實現(xiàn)分類特征的處理。在這個過程中,嵌入表存儲在DRAM中,而CPU對嵌入表進行操作,這就對內存帶寬和內存容量提出了雙重挑戰(zhàn)。

在內存帶寬上,像美團和騰訊等廠商紛紛采用多GPU加速的方式,充分利用GPU的帶寬,但這種方式依然需要多個GPU或多個服務器的支持才能解決容量問題。固然廠商也可以選擇像HBM這種大帶寬的內存方案,但帶來的成本提升也是巨大的。

根據Meta給出的說法,在Facebook社交網站的個性化推薦系統(tǒng)中,大規(guī)模的嵌入表可達到百萬行以上,導致推薦模型的大小達到10GB左右,一個神經推薦模型中所有嵌入表甚至需要TB級別以上的空間。比如Meta旗下的Instagram已經在開發(fā)10TB的推薦模型,而百度的廣告排名模型也達到了10TB。這種級別的容量需求對硬盤來說或許足夠,但對于內存來說過于奢侈了。

因此為了解決容量問題,不少人也提出了SSD的存儲解決方案,目前傳統(tǒng)的SSD雖然可以毫不費力地存儲下大規(guī)模推薦系統(tǒng),但讀取延遲和帶寬都要更差一籌,從而顯著降低推理的性能。

專為推薦而生的SSD

Esperanto與三星合作開發(fā)出了一種AI-SSD的概念模型,來研究將所有嵌入表處理全部移到SSD內部會有怎么樣的影響,從而省去推薦系統(tǒng)中經過CPU和DRAM的環(huán)節(jié)。三星展示了使用Esperanto的ET-SoC-1芯片與其PM9A3 SSD結合的成果。

在AI-SSD中,所有嵌入表都被存儲在SSD里,CPU負責所有的用戶數據輸入和深度神經網絡,而SSD內部的ET-SoC-1負責嵌入表的查詢和交互運算。此外由于選擇了這種存內計算的方式,最小化了PCIe鏈路上的數據傳輸,降低了讀寫的高延遲,最終的分類數據直接交給CPU生成推薦結果。

AI-SSD帶寬性能測試結果 / Esperanto

測試環(huán)節(jié)中,Esperanto選用了Meta的開源推薦模型DLRM,將AI-SSD與傳統(tǒng)的CPU-SSD方式進行對比。在不同的模型配置下,AI-SSD實現(xiàn)了10到100倍的讀取帶寬提升,而且?guī)掚S著使用核心數的上升還能繼續(xù)線性提升。

要知道在這次測試中,Esperanto最多只用到了四個子節(jié)點(Minion Shire),每個節(jié)點只有32個核心。而一整個ET-SoC-1有34個子節(jié)點1088顆核心,如果所有計算單元全部用于SSD的話,提升幅度將達到數百倍以上,十分適合數據中心級別的SSD產品。而ET-SoC-1的擴展性也可以讓它縮減核心數,用于一些邊緣端的推薦系統(tǒng)。

拿計算換空間

不過即便用上了AI-SSD,這也是一種增加硬件成本的路線,除了不差錢的大公司會利用這種產品外,一些小的互聯(lián)網應用可能并不會直接選擇更換SSD的方式,如此一來,也就只有繼續(xù)優(yōu)化推薦模型一途。

佐治亞理工學院和Meta的研究院為DLRM提出了一種張量訓練壓縮的方式,名為TT-Rec。該方法通過將嵌入表分為多個小矩陣相乘的方式進行壓縮,進一步降低嵌入表的大小,不過這多出來的計算是肯定躲不掉的額外消耗,好在其評估結果足夠優(yōu)秀。

在Kaggle和Terabyte數據集的測試訓練下,TT-Rec分別將數據從2.16GB和12.57GB壓縮至18.36MB和0.11GB,整體的大小壓縮均在百倍以上,甚至可以做到幾乎沒有精度損失。而多出來的運算則反映到了訓練時間上,分別增加了14.3%和13.9%。因此在實際使用中,必須對內存容量、模型精度和訓練時間做出一定的取舍。

小結

盡管從推薦系統(tǒng)配置的角度來說,仍有不少可選的解決方案,但存算一體方面的研究已經全面鋪開了。存儲市場正在迅速與計算市場發(fā)生重疊,像三星、西數和希捷等存儲廠商紛紛開始了這塊的布局,傳統(tǒng)的馮諾依曼架構也將被近數據處理替代。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SSD
    SSD
    +關注

    關注

    21

    文章

    3147

    瀏覽量

    122583
  • AI
    AI
    +關注

    關注

    91

    文章

    40908

    瀏覽量

    302489
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    基于FDP SSD的ROCKSDB寫放大優(yōu)化

    作為SSD的關鍵指標,寫放大(WriteAmplification,WA)始終是SSD領域待攻克的技術難題之一。其本質表現(xiàn)為SSD的實際物理寫入量超過主機原始請求寫入量。
    的頭像 發(fā)表于 03-23 09:16 ?525次閱讀
    基于FDP <b class='flag-5'>SSD</b>的ROCKSDB寫放大優(yōu)化

    MangoTree Halo Ultra「全新PXI」,標配自動糾錯內存#

    內存
    芒果樹數字
    發(fā)布于 :2026年03月06日 15:59:34

    每塊GPU對應16TB SSD,英偉達KV緩存虹吸高性能TLC SSD

    HBM4 內存量產交付之外,三星存儲器業(yè)務計劃全方面積極應對AI相關需求,重點提升面向 AI KV(鍵值)存儲需求的高性能 TLC SSD的銷售
    的頭像 發(fā)表于 02-10 11:12 ?1.4w次閱讀

    DRAM緩存真有那么重要嗎?天碩工業(yè)級SSD固態(tài)硬盤實測告訴答案!

    在國產固態(tài)硬盤推薦榜中,推薦五花八門,很多用戶疑惑DRAM 緩存 SSD 值得買嗎?不同方案的國產 SSD 性能對比差距到底有多大?價格差距不小,性能也各說各的好。要弄清兩者的實際差異,先看國產 SSD 性能對比 —— 尤其是緩
    的頭像 發(fā)表于 01-19 16:49 ?407次閱讀

    兆芯近期適配重點產品推薦

    近期,兆芯繼續(xù)攜手多家生態(tài)伙伴推進ZX86自主生態(tài)建設,圍繞開勝KH-50000、開先KX-7000等處理器平臺,完成了包括SSD、內存、IP廣播系統(tǒng)服務器、智慧工廠軟件、醫(yī)學影像存儲與傳輸軟件等產品的兼容適配認證,進一步為行業(yè)
    的頭像 發(fā)表于 01-12 17:18 ?1220次閱讀

    C語言嵌入式系統(tǒng)編程注意事項-內存操作

    址單元內容的讀寫能力。以指針直接操作內存多發(fā)生在如下幾種情況: (1) 某I/O芯片被定位在CPU的存儲空間而非I/O空間,而且寄存器對應于某特定地址; (2) 兩個CPU之間以雙端口
    發(fā)表于 01-04 07:31

    不同位數的CPU的變量所占的內存

    不同位數的CPU(單片機)的變量所占的內存也不盡相同,具體如下表所示。 8位16位32位64位 char1 Byte1 Byte1 Byte1 Byte short int2 Byte2 Byte2
    發(fā)表于 12-09 07:30

    兆芯CPU近期適配重點產品推薦

    近期,兆芯攜手多家產業(yè)伙伴,圍繞開勝KH-50000、開先KX-7000等高性能自主CPU產品推進應用生態(tài)建設,完成了人工智能算力卡、SSD內存、NAS存儲、數據庫管理系統(tǒng)、綜合安全
    的頭像 發(fā)表于 11-07 17:13 ?1568次閱讀

    專為內容創(chuàng)作、AI應用打造的存儲設備來了!閃迪媒體分享會展示新款SN5100 SSD

    近期在閃迪召開的媒體分享會上,閃迪為參會媒體介紹了其最新產品WD Blue SN5100 NVMe SSD的主要技術特性。這是一款專門為內容創(chuàng)作者和各種生產力套件的專業(yè)人士打造的一款產品,因為當前
    的頭像 發(fā)表于 09-25 17:55 ?579次閱讀
    專為<b class='flag-5'>內容</b>創(chuàng)作、AI應用打造的存儲設備來了!閃迪媒體分享會展示新款SN5100 <b class='flag-5'>SSD</b>

    為什么推薦 SSD 而不是 HDD 的電腦?

    一、SSD 與 HDD 的本質區(qū)別? 1.存儲原理? 固態(tài)硬盤(SSD):采用NAND閃存芯片存儲數據,類似“大號U盤”,無任何機械運動部件。數據通過電子信號讀寫,速度極快,且抗震動、噪音低
    的頭像 發(fā)表于 09-25 16:19 ?1757次閱讀
    為什么推薦 <b class='flag-5'>SSD</b> 而不是 HDD 的電腦?

    代理供應希力微 SJ MOS管 SSF60R190TH、SSD60R280FTR、SSD60R360METR、SSD65R900FTR

    、快速充電器、LED電源、通訊和服務器電源、電動車充電樁等系統(tǒng)。 SSQ55R115FTH、SSD55R280FTR、SSD100R1K4METR、SSF100R1K4METH、SSD
    發(fā)表于 08-27 09:49

    兆芯CPU近期適配軟硬件產品推薦

    近日,兆芯持續(xù)攜手多家產業(yè)合作伙伴,圍繞開先KX-7000、開勝KH-40000等兆芯高性能自主處理器加強軟硬件生態(tài)建設,共同完成包括AI加速卡、內存、企業(yè)級SSD、服務器操作系統(tǒng)、安全操作系統(tǒng)
    的頭像 發(fā)表于 08-20 17:39 ?2332次閱讀

    兆芯CPU近期適配重點產品介紹

    近期,兆芯繼續(xù)與多家產業(yè)伙伴通力合作,圍繞開先KX-7000、開勝KH-40000等高性能自主CPU產品持續(xù)推進應用生態(tài)建設,完成了國產SSD、內存、Web中間件、分布式數據庫、大數據
    的頭像 發(fā)表于 07-10 17:02 ?1341次閱讀

    工業(yè)級SSD為什么需要掉電保護?天碩工業(yè)級SSD固態(tài)硬盤告訴答案

    在工業(yè)控制和嵌入式系統(tǒng)中,電源波動或突發(fā)斷電是常見問題。這種情況下,如果SSD正在寫入數據,很可能導致數據丟失或文件系統(tǒng)損壞,甚至引發(fā)系統(tǒng)宕機。天碩(TOPSSD)G40工業(yè)級固態(tài)硬盤,針對這一
    的頭像 發(fā)表于 07-09 17:05 ?964次閱讀

    服務器CPU架構解析,從x86到ARM:一文吃透其分類及對應品牌優(yōu)勢

    為什么的服務器總在"喘氣"?CPU架構才是關鍵。大家可能都遇到過這樣的情況:公司剛采購的服務器用了不到半年,跑個數據庫就像老牛拉車,加內存換硬盤都沒用。這時候老工程師會叼著煙告訴
    的頭像 發(fā)表于 04-30 15:11 ?2149次閱讀
    服務器<b class='flag-5'>CPU</b>架構解析,從x86到ARM:一文吃透其分類及對應品牌優(yōu)勢
    阿鲁科尔沁旗| 高雄县| 桂阳县| 沁源县| 万山特区| 泌阳县| 清镇市| 深水埗区| 枞阳县| 封丘县| 北海市| 格尔木市| 湘西| 涞水县| 无极县| 台州市| 集贤县| 逊克县| 呼玛县| 车险| 南投市| 亚东县| 贵定县| 阳春市| 武陟县| 抚顺市| 娱乐| 手游| 城口县| 星子县| 娄烦县| 类乌齐县| 刚察县| 廉江市| 海伦市| 额敏县| 新宁县| 普兰店市| 阿坝县| 博客| 阳谷县|