熱門關(guān)鍵詞: 聯(lián)樂 宇瞻工業(yè)級TF卡 工業(yè)閃存卡品牌 固態(tài)硬盤品牌
工業(yè)級固態(tài)硬盤和軍工級固態(tài)硬盤必須擁有極高的可靠性。但是,現(xiàn)實(shí)中固態(tài)硬盤會遭受復(fù)雜、苛刻的環(huán)境和使用工況,供電偶爾遭遇故障或者失效。遺憾的是,SSD固態(tài)硬盤對于這種外部電源的異常掉電的抵抗能力先天不足,異常掉電會造成數(shù)據(jù)丟失,甚至整個固態(tài)硬盤失效。
電源的失效事件包括從瞬態(tài)欠壓到長時間完全斷電的情況。這些事件可以因?yàn)楣╇娋W(wǎng)絡(luò)、外置UPS的部件、系統(tǒng)電源(熔斷,線纜故障),或者是在振動、熱量、沖擊等條件下的PCB或者連接頭失效而引起。
睿達(dá)硬件級斷電保護(hù)功能的SSD
SSD固態(tài)硬盤層面的電源失效的風(fēng)險,部分的決定于安全供電的措施是否完善。電源失效能夠?qū)е孪到y(tǒng)延遲,甚至永久性的數(shù)據(jù)丟失。根據(jù)睿達(dá)研發(fā)部門進(jìn)行的數(shù)十萬次主機(jī)異常掉電測試發(fā)現(xiàn),目前市面上的各類SSD固態(tài)硬盤,根據(jù)產(chǎn)品的不同,大約有1/346~1/2000的概率導(dǎo)致SSD固態(tài)硬盤系統(tǒng)數(shù)據(jù)損壞導(dǎo)致無法識別。根據(jù)第三方的測試,大約有1/170~1/2000分之一的情況下,丟失系統(tǒng)數(shù)據(jù)。
對SSD固態(tài)硬盤而言,掉電保護(hù)比其他設(shè)備更加必要。這和SSD固態(tài)硬盤的存儲介質(zhì)——閃存的有很大的關(guān)系。當(dāng)SSD固態(tài)硬盤正在對一個Nand閃存的塊進(jìn)行編程(寫入)時,編程的操作必須完整執(zhí)行,以確保數(shù)據(jù)可靠地保存。當(dāng)正在編程時,SSD固態(tài)硬盤的供電出現(xiàn)問題的話,對數(shù)據(jù)是一種極大的危險,尤其是對MLC介質(zhì)的SSD固態(tài)硬盤。對MLC閃存而言,這種危險是雙重的。
原因有兩個:
一是Nand閃存讀取的最小單位是頁,而擦除的最小單位是塊。當(dāng)一個新的頁的數(shù)據(jù)需要寫入時,SSD固態(tài)硬盤通常需要將寫入目標(biāo)頁的"鄰居"讀取到緩存,合并成新的數(shù)據(jù)進(jìn)行存儲或者轉(zhuǎn)存。如果在這個過程當(dāng)中電源失效,就會有很大的風(fēng)險。
原因二是因?yàn)镸LC Nand Flash使用存儲單元的同一個物理頁,來存儲2個邏輯頁的數(shù)據(jù)。當(dāng)在對高頁進(jìn)行編程中電源失效,低頁所存儲的有效數(shù)據(jù)也會丟失或損壞。通常我們將其稱為"低頁數(shù)據(jù)損壞"。TLC也是同理。
用戶數(shù)據(jù)丟失,和主機(jī)操作系統(tǒng)—SSD固態(tài)硬盤的"通信"方式有關(guān)。當(dāng)主機(jī)將數(shù)據(jù)寫入指令發(fā)送給SSD固態(tài)硬盤時,這些數(shù)據(jù)實(shí)際還存儲在緩存中。為了追求高性能,SSD將會通知主機(jī)操作系統(tǒng)數(shù)據(jù)已經(jīng)完整寫入,實(shí)際上,數(shù)據(jù)仍然在處理中。如果此時電源失效,SSD固態(tài)硬盤的主控?zé)o法在斷電之前完成數(shù)據(jù)寫到閃存,那么數(shù)據(jù)將會丟失。之后,當(dāng)主機(jī)請求這些數(shù)據(jù)時,SSD控制器可以報告這些數(shù)據(jù)已經(jīng)"無法恢復(fù)"或者提供原有的舊數(shù)據(jù)給主機(jī)。后面這種情況下,主機(jī)甚至都不知道數(shù)據(jù)是不正確的。
02 丟失系統(tǒng)數(shù)據(jù)SSD固態(tài)硬盤為了提高性能,板載Flash之間組成了陣列/RAID的方式在運(yùn)作,所有的數(shù)據(jù)都是分散到多片F(xiàn)lash存儲。同時,在每一片F(xiàn)lash中,數(shù)據(jù)的存儲位置都不是連續(xù)的。這些動作,都由SSD固態(tài)硬盤控制器中,F(xiàn)TL層操作。所有這些數(shù)據(jù)的存儲,都會形成一張映射表存儲,以便SSD控制器實(shí)現(xiàn)物理LBA地址和主機(jī)邏輯LBA地址之間的轉(zhuǎn)換或翻譯。映射表必須被創(chuàng)建并維護(hù),否則就無法讀取所存儲的數(shù)據(jù)。而每當(dāng)新數(shù)據(jù)寫入時,映射表必須被更新。映射表文件被存儲在SSD固態(tài)硬盤的某個區(qū)域,輔以比用戶數(shù)據(jù)更高水平的ECC保護(hù)。而映射表數(shù)據(jù),在主機(jī)斷電時,也難逃厄運(yùn)。如果斷電時映射表數(shù)據(jù)丟失,SSD固態(tài)硬盤將會表現(xiàn)為數(shù)據(jù)損壞,返回(損壞的)舊數(shù)據(jù),或者徹底的無法識別。
Agrade睿達(dá)存儲的異常斷電保護(hù)有固件級和硬件級兩類:小容量SSD采用固件級斷電保護(hù),大容量SSD在固件級斷電保護(hù)的基礎(chǔ)上增加了硬件級斷電保護(hù)功能。硬件級斷電保護(hù)需要有獨(dú)立的硬件電路,包括應(yīng)急供電用的電容、用于發(fā)現(xiàn)斷電并觸發(fā)保護(hù)機(jī)制的電壓監(jiān)視控制芯片等。
睿達(dá)所有的固態(tài)硬盤在設(shè)計時都會考慮掉電保護(hù)機(jī)制,而且要能覆蓋所有可能發(fā)生的極端條件,以及保護(hù)機(jī)制自身不會犯錯,這也是工業(yè)級固態(tài)硬盤和軍工級固態(tài)硬盤區(qū)別于其他一般消費(fèi)類固態(tài)硬盤的關(guān)鍵因素。