软件定义存储和全闪存阵列虽是存储领域两大热门话题,但是落地的案例却非常少。特别是软件定义存储,不管是厂商还是客户都是讨论为多,实践为少。至于软件定义存储与全闪存阵列相结合的案例则更是少见。而近日IBM为大数据时代再造存储摇滚盛典上,中国石油集团东方地球物理勘探有限责任公司研究院副总工程师赖能和先生分享了所在企业使用弹性存储+全闪存阵列,为地震数据分析提供了大容量、快速、稳定的存储支撑,提高元数据查询速度以及地震数据处理和分析的效率的案例。
中国石油集团东方地球物理勘探有限责任公司研究院副总工程师赖能和
中国石油集团东方地球物理勘探有限责任公司的工作涉及大量地震数据的采集、分析和检索。这家企业需要系统所满足的条件主要有三个,首先是高性能。大量地震数据的采集、分析和检索需要短时间内完成;第二就是大容量。据悉中国石油东方地球物理公司地震解释系统高性能计算项目的数据总量达到PB级;第三是灵活。这里的灵活有两个方面的意思,首先是架构灵活,架构上的灵活性能够保证整个解决方案具有良好的扩展能力,另一方面是灵活的配置和功能的调整,意思是说解决方案需要根据客户的具体需求进行调整和优化。
赖能和说:“石油勘探实际上是一个专业技术含量非常高的行业,所以会积极采用很多IT新技术,而且投入比较大。对于新技术的投入主要有两个方式:一个是采购,引进一些新技术,比如说中国石油集团东方地球物理勘探有限责任公司常年采购IBM或者其他IT厂商的新品;第二就是自己开发。中国石油集团东方地球物理勘探有限责任公司现在有三百多人做软件开发。”
中国石油集团东方地球物理勘探有限责任公司的软件定义存储解决方案中,配置了GPFS作为软件层用于管理底层物理存储资源,并向上提供一个全球统一的命名空间。存储阵列方面,公司使用了两套IBM Flashsystem 810,通过IBM GPFS的镜像复制功能实现了系统冗余(以1.4PB的数据处理总量计算,其中元数据大约为3TB-4TB,而单台IBM Flashsystem 810的可用容量是6TB,这样估算起来FlashSystem完全可以满足元数据存储需求,另外经测试,将元数据集中式存放在高速闪存阵上,顺序读性能提升了1495倍 )。
除了GPFS和FlashSystem,这个案例中还有大量的DCS3700磁盘阵列用于存储其他的数据。这个案例有这样几个特点,首先GPFS处于一个绝对的核心地位,意思是说他控制着底层所有的物理存储资源,高性能的全闪存阵列承担关键业务负载,存放元数据,大容量的磁盘存储日常数据或者冷数据,而这些对于上层应用来说都是透明的;第二,解决方案具有非常高的弹性。这里的弹性包括实现模块化的灵活扩展、实现灵活的配置和功能的调整;第三灵活架构(系统的所有组件都是松耦合的关系,交换模块、存储模块等不同模块可以自由组合,不受限制)。
总结:
以GPFS为核心的弹性存储是IBM当下软件定义存储最新的成果,其主要功能就是搭建一个灵活的架构。我们从中国石油集团东方地球物理勘探有限责任公司的案例中可以看到,弹性存储+全闪存阵列的解决方案可以满足客户在这个解决方案最终的效果是满足了客户对存储性能、高可扩展性、大容量以及成本上的需求。当然,这个客户当时国内最早一批应用软件定义存储解决方案,而且其中还有FlashSystem全闪存阵列的加入。相信未来随着软件定义存储的规范化发展,中国石油集团东方地球物理勘探有限责任公司的实践当是一个灯塔案例,给予客户一个重要的参考标准。