最初,Backblaze只是一家廉价云存储服务商,曾提供每月5美元不限容量的存储服务。因此单谈Backblaze这家公司或许会比较陌生,但是如果说起近日的“希捷门”,相信很多人都会有一些印象。
“希捷门”事件回顾
Backblaze:5家公司15种型号,希捷最差!
事件起源于该公司博客上的 一篇硬盘品质报告,Backblaze重点对比了希捷、西数、日立3家公司出品的磁盘,得出的结论则是“日立最稳定,希捷最差”。
2013年,Backblaze测试评估了来自5家公司15种型号的27134块硬盘,结果显示日立(已被西数收购)故障率最低,存活率最高,在36个月后硬盘可正常工作概率仍达96.9%;西数排第二,虽然有一批产品在3个月内出问题,但最后存活率仍达94.8%;希捷三大品牌排名最末,3年后存活率仅有73.5%。Backblaze并没有掩饰其购买的是“价格比较好”的磁盘,同时它也公布,在生产环境中,希捷的故障率仍然最高。
希捷:采购、使用环境等,你哪条合格?
在希捷的反击中,工程师首先表示,在这段时间,你们尝试了各种方式的宣传,甚至不惜引发疑问来突出自己,就个人而言,我很庆幸没有被分配去宣传某些公司或其产品。随后,他从多个方面回击了这一评测日志:
1. 硬盘的采购:为了提供便宜的服务,你们选择最便宜的磁盘,不分场景的进行使用,只要通过测试,就进行使用。在2011 年磁盘危机时间,你们更是不择手段地抢购,甚至出现有些员工被经销商列入黑名单的情况,从故障发生在硬盘使用最初的几周时间就可以想象你们的品控,而使用这样资源得出评测报告的可用性可想而知。
2. 机箱的设计:为了获得高的密度,你们在每个机箱中安装了45 块硬盘,硬盘之间的震动相互影响,而在机箱插入服务器后更会引起连锁反应,导致硬盘的频繁故障,很显然希捷的硬盘出现在你们早期未改良的机箱中。如果我们的年故障率真高达25.4,那直接关门好了。
3. 温度的控制:从你们公司博客中我们发现,机架顶部pod 中的硬盘温度比较低层硬盘平均高出三度;Pod中心的硬盘温度相比边界硬盘高出五度;pod无需6风扇,只使用2个硬盘便可维持建议运行的温度;至少在Storage Pod中热量与硬盘故障无关。首先,硬盘温度和热量无关绝对是错误的;其次即使在温控范围内,但是温度不同也会造成寿命不同。
4. 用例的负载:你们采购最廉价的硬盘,无视额定功率,造成硬盘高故障率很正常。而在不同的负载下进行比较就更加的行不通了,比如随机读取会损坏磁头。可以确定的是,你们的工作负载完全超出了硬盘设计的极限。
言归正传,抛开与希捷的恩怨情仇,Backblaze确实在为一个非常有意义的目标奋斗着——以尽可能低的开销为客户交付卓越的价值。因此,除了在硬盘上控制成本之外,他们更设计出了一套大规模存储系统,也就是上文提到的Storage Pod 。目前Backblaze的开源存储架构已经迭代到180TB成本9305美元,每GB存储成本创下0.0517的新纪录。下面我们一起看最新版本4.0中的新特性。
Storage Pod 4.0
1. 使用更快的SATA Card 。Storage Pod 4.0使用了2个HighPoint Rocket 750替换了之前3张SATA Card结构,每个Rocket 750都通过6 Gbps Mini-SAS接口支持40个直连SATA设备通道,Rocket 750则通过8x PCIe 2.0卡槽连接主板。对比3.0版本,当下的吞吐量提升大约4到5倍。虽然Backblaze从未遭遇吞吐量瓶颈,但4.0版本却可以提升RAID阵列与系统的同步速度。
2. 连接器直接连接硬盘。在4.0 版本之前,磁盘的供电和连接都是通过底板完成,在版本更新后,每块硬盘都有独立的连接器来支撑供电和SATA连接,SATA连接会直接和Rocket 750交互,所有的45个连接器会被分为3组置于底座中。直接连接硬盘有多个好处:第1,降低了底板的设计复杂性;第2,取消了5个一组的底板,所有磁盘的管理和设置都可以在主板或者是SATA Card中进行;第3,连接器的故障率比底板要低;第4,底板坏了的话会影响到5块磁盘,连接器只会影响到1个。
3. 新的SATA 电缆。每个Rocket 750都拥有10个接口,分别使用Mini-SAS连接器,新的SATA电缆会将Mini-SAS转接器转换成4个独立的电缆,这4个电缆会分别通向连接磁盘的连接器,新的电缆可以同时完成SATA连接和供电。
4. 一个电源。之前版本的Storage Pod 拥有2个电源,花费约占整个机架的25%(不包括磁盘)。两个电源并不是用于容灾,机架确实就需要如此多的功率,它需要为45块磁盘、主板以及为其他组件供电。单电源模式有效的减少了开销和复杂性,在减少重量的同时还增加了系统的稳定性。
5. 更薄的机架和新的侧边设计。替换下底板还带来了另一个好处——从17 5/8 到17 1/8,将支架的宽度减少了半英寸。这就允许了新的侧边设计,之前一直很锋利(甚至经常割伤运维人员)的L-bracket得以处理。
6. 更快的CPU 。CPU从i3-2100 (Sandy Bridge)升级到i3-3240(Ivy Bridge),这将让处理变得更快,在结合了Rocket 750之后,吞吐量更是提升了4-5倍。在测试中,i3-2120和i3-3220表现的也不错,但是鉴于他们与i3-3240的价格相差不多,我们果断的选择了后者。
7. 引导磁盘。引导磁盘从侧面移到了底座的后面。新的位置不仅方便线缆的布局,也方便设计两侧的扶手,新的位置可以放置1到2个2.5英寸磁盘。