監(jiān)督成本| eMMC NAND閃存技術和用例需求
ODI最近對較舊的Teslas Model S和Model X車輛提出的信息要求突顯了工作負載疏忽,其中基于NVIDIA Tegra 3處理器和集成8GB eMMC NAND閃存的主控制單元(MCU)遇到了問題。當引入新的固件更新為電動汽車(EV)帶來附加功能時,問題變得更加復雜。這充當進一步激發(fā)NAND閃存磨損進度的燃料。盡管在一開始固件不是問題,并且記錄的數據具有足夠的內存來處理工作量,但每次固件升級都帶來了新功能,從而減少了每次更新的存儲空間。應ODI的信息請求,特斯拉列出了2,399項投訴和現(xiàn)場報告,7,777項保修索賠以及4,746項與MCU替換方案有關的非保修索賠。倒車時,故障的MCU導致后置攝像頭圖像顯示遺失。隨著NAND閃存全部耗盡,駕駛員不能再使用車輛的某些功能,例如HVAC(除霧),與ADAS相關可聽得見的提示音,自動駕駛儀和轉向信號燈,嚴格地來說盡管車主仍然可以駕駛車輛,但不能再充電,使汽車無法運行。
eMMC模塊因為是以NAND閃存技術為基礎而具有預定的使用壽命。它們具備有限的程序/擦除(P/E)周期,即使公司最初按照這些規(guī)范進行設計,他們也必須預見到同一系統(tǒng)隨著時間的推移必須應對不斷增加的工作負載挑戰(zhàn)。最后,這問題有三個方面。缺乏對NAND閃存技術的了解,以及對更加復雜和多面的用例了解,并且假設驅動器的使用期限完全取決于NAND閃存技術–而不是正在使用的閃存控制器。
了解NAND閃存技術
根據特斯拉維修專家的說法,由于eMMC中的NAND閃存單元結構,在較舊的Model S和X組件中發(fā)現(xiàn)的基于嵌入式NAND的eMMC磨損。在一定程度上是對的。不同類型的NAND閃存技術具有不同(但始終是有限的)的P/E周期數或他人所稱的“寫入周期”。
SLC NAND閃存技術大約10萬次P/E周期
MLC NAND閃存技術大約10 000-3500 P/E周期
TLC NAND閃存技術大約3000個P/E周期
QLC NAND閃存技術大約1000-100次P/E周期
這意味著一旦這些周期用完,驅動器將再也無法可靠地存儲數據。根據特斯拉的報告,Hynix單元“針對eMMC中每個NAND閃存塊,額定3,000個編程/擦除周期”。
要了解NAND閃存單元為何總是具備有限的P/E周期,必須了解其基礎技術。NAND閃存是一種非易失性存儲器(NVM)技術,它通過電荷陷阱技術或浮柵MOSFET晶體管將數據存儲在制成的存儲單元陣列中。通過在晶體管的控制柵極上施加高電壓,同時將源極和漏極接地,溝道中的電子可以獲得足夠的能量來克服氧化物勢壘,并從溝道移入浮柵。在浮柵中捕獲電子的過程是閃存設備的編程(或“寫入”)操作,該操作對應于邏輯位0。相反,擦除操作從浮柵中提取電子,從而切換存儲在其中的數據NAND閃存單元磨損,因為編程和擦除周期最終會損壞浮柵和基板之間的隔離層。這減少了數據保留,并可能導致數據丟失或意外編程的單元。
了解用例的工作負載
特斯拉電動汽車對于任何存儲應用都是一個充滿挑戰(zhàn)的環(huán)境,這不僅是因為汽車質量對溫度和功能安全性的要求,而且因為每輛汽車的使用方式都不同。在這種情況下,eMMC模塊會受到每日行駛時間,每日充電時間,每日音樂流式傳輸時間以及一系列其他因素的影響。此外,極其重要的功能和特性取決于MCU能夠可靠地執(zhí)行其工作。這個生態(tài)系統(tǒng)中的eMMC具有非常獨特的工業(yè)級工作負載,只有使用符合工業(yè)標準設計的高質量閃存控制器才能適當取得。
特斯拉認為“以每塊0.7的額定每日P/E周期使用率計算,在設備中每塊平均獲得3,000個P/E周期需要11到12年的時間,以每塊 1.5的每日P/E周期使用速率的第95個百分位,在設備中平均累積3,000個P/E周期需要5到6年時間。”歸根結底,復合固件更新的苛刻性質使這些驅動器比預期還早崩潰。這就引出了一個問題,為什么這些MCU這么早崩潰?
了解NAND閃存控制器的作用
閃存控制器在高端存儲系統(tǒng)中的作用常被忽略。在NAND閃存經常引起關注的地方,許多人忽視了評估控制器在管理其應用程序方面的真實能力,而所選閃存則預定義了P/E周期。盡管閃存技術在定義驅動器的使用壽命方面起著重要作用,但所選的控制器應掩蓋閃存的所有固有缺陷,從而延長其使用壽命,確保不會出現(xiàn)任何故障設備或數據損壞。
例如,閃存控制器可以針對任何特定的存儲設備執(zhí)行最佳類型的糾錯編碼(ECC),完全取決于所選NAND閃存的特性以及控制器中可用的處理性能。在不同類型的NAND閃存中,不同類型的錯誤也更為常見,例如多層單元(MLC)中更容易出現(xiàn)讀取干擾錯誤,而其他控制器功能(如損耗均衡)和垃圾回收的時間也會受到NAND閃存中過度配置的影響。因此,控制器需要仔細匹配NAND閃存的特性,如果忽略這一點,驅動器在預測的時間之前提早崩潰也就不足為奇了。這是一項昂貴的疏忽,選擇正確的閃存控制器是設計高效可靠的存儲系統(tǒng)(如eMMC模塊)必不可少的一個部分。
歸根結底,在工業(yè)中–故障系統(tǒng)和數據損壞不像在其他市場中那樣被接受,因為期望壽命和故障成本更為急切。像eMMC模塊這樣的存儲系統(tǒng)需要針對其獨特的工作負載進行設計,并進行適當的管理,以避免在其特定領域發(fā)生故障。最后,閃存控制器在掩飾所選NAND閃存技術的缺陷方面起著非常重要的作用,應被視為核心組件,而不僅僅是NAND閃存的支援。
審核編輯 黃昊宇
-
芯片
+關注
關注
463文章
54409瀏覽量
469082 -
mcu
+關注
關注
147文章
19116瀏覽量
403480 -
emmc
+關注
關注
7文章
274瀏覽量
56271
發(fā)布評論請先 登錄
UUU 工具無法使用 Windows 11 將映像刷新到 EMMC,怎么解決?
S32M276官方程序無法運行,請問這是怎么回事,要怎樣解決?
調試ddrinit的時候,ddrinit在trap時出現(xiàn)輸出亂序的情況,這是怎么回事呢?
無法從 emmc 啟動怎么解決?
KT6368A藍牙芯片在廣播間隙導致的電源抖動引起mcu被喚醒說明
把qspi0配置成了普通的fifo模式,讀什么都返回0xff,這是怎么回事?
rt thread studio 創(chuàng)建的K210工程編譯后很多警告是怎么回事?
STM32標準庫在Keil5移植rtthread nano后無法顯示oled內容是怎么回事?
micropython 文件同步失敗是怎么回事?
stm32f103c8t6 PWM設置后不生效是怎么回事?
工業(yè)網關的emmc是什么
服務器數據恢復—硬盤離線導致raid上層的卷無法掛載的數據恢復案例
SPI+DMA一直發(fā)會進入HAL_BUSY無法跳出是怎么回事?
變頻器無法正常控制負載原因及解決
eMMC芯片磨損導致MCU和車輛無法正常運作,這是怎么回事?
評論