Board logo

标题: 固态硬盘连写1500TB:最神奇的莫名完蛋了! [打印本页]

作者: 爱国者    时间: 2014-9-30 11:52     标题: 固态硬盘连写1500TB:最神奇的莫名完蛋了!

TechReport进行的固态硬盘持续写入试验在不久前跨过了1.5PB的大关,换用大家更熟悉的计量单位就是1500TB。都说闪存很脆弱,但是消费级产品能够坚持到PB级别,相信绝大多数人都没有想到吧。
当然了,毕竟是消费级产品,毕竟不是专为超大数据量持久写入而设计的,参与测试的六块固态硬盘陆陆续续出现了各种问题。1PB就干掉了其中的三块,现在又牺牲了一个,而且是最没想到的一个。

参测固态硬盘:
- 海盗船Neutron GTX 240GB
- Intel SSD 335 240GB (已死)
- 金士顿HyperX 3K 240GB(可压缩)
- 金士顿HyperX 3K 240GB(不可压缩数据) (已死)
- 三星840 250GB (已死)
- 三星840 Pro 256GB


其中海盗船之前一直表现稳健,没有任何错误,没有任何性能下滑,事实上性能反而在持续缓慢上升,实在难以理解。
但同样难以理解的,是它的突然死亡。
写入约1.1PB之时,Neutron GTX出现了三个重分配区块,按说不多,S.M.A.R.T.警告却很快就出现了,说原始读取错误率超过了阈值。
即便如此,仍然看似风平浪静地坚持到了1.2PB,但检测发现重分配区块数量暴涨,已经超过了3400个。


然后就完蛋了。准备进入下一个阶段的时候,系统无法启动,而之前几块固态硬盘就是这么死的。热插拔也无效,能检测到硬盘,但是访问的时候磁盘管理器失去响应。
这根本不科学啊。固态硬盘挂掉之前,理应有一段缓冲期,尤其是应该进入一段只读状态,方便用户转移、保存数据,但是Neutron GTX突然就彻底无法访问了。


Neutron GTX S.M.A.R.T.属性里的参数还是很丰富的,但都比较奇怪。重分配扇区指标就有俩,一个从0开始,一个从256倒数,其中后者到死都没有归零。
剩余寿命也在一直稳定递减,但到最后也还有很多。
刚才说的原始读取错误率最后显示为零,但并不完全准确。1108TB之后它就已经到了最低值,也就是错误最初开始出现的时候。
Neutron GTX的死因仍待进一步调查,海盗船也未提供扇区尺寸、冗余替换比例等指标。
作者: 爱国者    时间: 2014-9-30 11:52

【最后两位勇士】
三星840 Pro、金士顿HyperX 3K(可压缩数据)都突破了1.5PB,还都完成了另外一次不加电存留测试。1.5PB写入后,二者都载入200GB测试文件,然后断电拔开,闲置一个星期,再次加电启动,MD5 Hash测试顺利通过,说明数据都完好无损。
Anvil Storage Utilities工具对720MB小文件进行的Hash检测同样没有任何错误。


840 Pro的出错速度在降低,但也有了3400多个重分配扇区(跟海盗船死前的差不多),每个1.5MB那就是损失了大约5GB。


损耗均衡指数早在500TB前后的时候就彻底归零了,到现在又写入了1PB,但用掉的冗余空间比例还是不到40%,仍然有很大的余地。
三星SSD Magician工具显示健康度仍然是良好(good),不过别忘了,840死前也是给的这个评级呢,看来很不靠谱。
HyperX 3K使用的SandForce主控支持压缩写入技术DuraWrite,这是第二块坚持至今的一大功臣。


主控写入1.5PB,而得益于压缩,实际写入闪存的之后大约1.07PB,也就是节省了三分之一。另一块写入不可压缩数据的,因为写入放大的存在,实际写入一直略高于主控写入。
如果压缩是维持其生存的唯一原因,那么在1.1PB左右就应该支撑不住了,不可压缩版就是这时候挂掉的,内置的健康指数也在那时候报警了。


但是,1.5PB写入完成后,这货仍然只有区区12个重分配扇区!不知道是不是这块盘的体质特别好,这种差异在半导体产品上是极为正常的,不过至少两块盘是同时抵达的,测试方法也完全相同。
再细挖S.M.A.R.T.数据,又发现了一些有趣的地方。


900-1000TB之间出现了2个不可恢复错误,恰恰就是头两个重分配扇区出现的时候,不知道是否巧合。无论如何,不可恢复错误是很致命的,它们会损坏数据、崩溃程序,甚至搞死整个系统。
编程与擦写错误分别有2个、3个,但它们都不致命,能够将其中的数据转移到其他完好区块上。性能可能会略有影响,但关系不大。


作者: 爱国者    时间: 2014-9-30 11:53

【现在性能咋样?】
好了,来看看读写性能的历史变化吧。当然到最后就俩了。


持续读取


持续写入


随机读取


随机写入


尽管有一些波动,但几乎所有固态硬盘自始自终性能都很平稳。
海盗船Neutron GTX在到达1PB的时候,持续读取出现了大幅度下滑,但在1.1PB节点恢复正常,可惜死之前又下去了。
三星840 Pro的持续写入有些反复,其他很稳定。
金士顿HyperX 3K虽然性能相对较低,但也表现稳健。


安全擦除后的性能,840 Pro依然频繁跳跃,HyperX 3K还是稳定但周期性来个峰值。
Neutron GTX之前一直在缓慢爬升,不可思议,不过到最后,很突然地,它就完蛋了。


再放大看最后一段。发现没?其他固态硬盘失效之前都出现了微弱的下滑,唯有海盗船,升着升着,就走了。
作者: 爱国者    时间: 2014-9-30 11:53

【下一个目标:2PB!】
虽然只剩下了两位,但是TechReport表示试验仍将继续进行下去,而获得的那么多宝贵经验是以前从来没有过的。
最关键的是,现代消费级固态硬盘的可靠性远远超出了一般想象,应付典型的日常使用实在是绰绰有余。全部六个试验品都毫无问题地写入了几百TB数据,后期虽然有各种各样的小毛病,但继续使用仍然影响不大。
另一方面,固态硬盘在到达预期寿命之后,问题和失效现象各有不同。大多数都能预先给出警告,甚至包括海盗船Neutron GTX,但也有说死就死的,因此在使用了很久之后,备份很重要。
840 Pro作为三星的旗舰产品,表现着实不俗(当年夸


它完美还真不亏),而且至今看起来很健康,还能继续坚持下去。
金士顿HyperX 3K虽然凭借数据压缩坚持至今,但也出现了一些致命错误,下一步很可能会倒下。
因此,840 Pro已经成了事实上的赢家。
截至目前,这两块盘都已经写入了1.6PB,而不把它们弄死,这个试验就不会结束!
2PB见……如果你们能坚持到的话……






欢迎光临 合肥本本之星 合肥Thinkpad专卖店 合肥Apple专卖店 hfthink 合肥本之星信息科技有限公司 (http://bbs.hfthink.com/) Powered by Discuz! 7.2