1 产品概述
01 背景与趋势
中国社会的信息化程度在快速深入和扩展,政府、企业、单位的对信息系统的依赖越来越大,
一旦故障,将导致业务无法正常运转,带来巨大损失,稳定运行变得越来越重要;
而基于各种新技术、新架构的支撑系统使得运维工作越来越复杂,
传统运维方式面临用人培养周期长、留不住人、技术难度复杂,排除故障经验不丰富的问题,造成成本居高不下,系统不断增多,保障服务难度越来越难以满足业务需求,甚至制约内部的业务升级。
02运维的痛点
■缺乏完整、准确的基础系统资料
1、资料信息不完整,日常巡查无法开展,发生故障后无法快速定位
※应用出现问题,后台有哪些服务?服务在那些服务器上?服务器的链路是怎么样的?是哪个环节出现问题?
※服务器出现问题后,会影响哪些应用?设备供应商是谁?联系人是谁?什么系列?什么型号?故障设备具体位置在哪里?
※交换机发生故障后,原来的配置是什么样的?网络的拓扑是如何的?
2、现场发生变动,资料难以更新及时
即使花费很大精力进行整理清晰,但使用一段时间后,资料档案与现场实况不符,出现故障还是无法利用资料档案快速定位。
■客户机基础维护工作量大,应用软件的故障难以快速跟踪
1、客户机呈现分布区域广,数量多,日常维护工作量大。
2、操作系统安装、应用软件、打印机驱动等工作量繁重、难以批量进行配置、设置;
3、应用软件出现问题,软件厂家、维护人员难以及时获取故障现场,周期拉长。
(用户发火,运维接电话拿笔记录)
■设备、应用的监测工具总是不给力
日常的监测、巡检是保障系统正常运转的重要手段,但要想做好这项工作却非常困难。
1、各类监测工具专业性强,苦涩难用,普通用户难以驾驭;
2、监测结果报警数量庞大,难以快速、智能识别,极大耗费人力物力;
3、监测信息简单、晦涩、信息不完整,影响面还要一点一点查;
4、涉及的技术面广,需要的专家种类多,报警信息的分析处理难度较大
5、运维工具种类繁多,各管一块,缺乏有效沟通,运维过程支离破碎。
■任务流程记录效率低,员工参与度不高,造成管理难以到位
1、任务处理过程难以把控:到哪里?现在什么情况?在哪个环节卡住了?问题解决还要多久?领导问了一圈一无所获,相关人员各种紧张。
2、任务处理过程中沟通不方便,历史沟通记录难重现,难以追踪事故责任。
3、任务经常被遗忘,没有及时沟通,用户怨气冲天;
4、工作量难以统计、质量无法评估;
■ 运维过程涉及工具、角色多,难以有效协同性:
1、运维工具种类繁多“各自为政”,无法互联互通,效率低下
2、使用人员、信息管理人员与服务商、集成商、软件商的业务协同经常”卡壳”;
3、出现的问题时,软件、硬件供应商各扫门前雪,相互推诿;
4、出现问题快速响应,却难以快速进入维修状态;
5、驻场人员难以保证解决所有问题,现场缺乏后方强有力的支援
03目标与理念
■统一、完整、协同、便捷、的工具平台
统一:
1、统一定义的基础信息:机构、组织、人员、位置、通讯录,
2、统一定义对象与类型:设备类型、服务类型、操作系统类型
3、统一定义附属管理系统:供应商管理、资产管理、合同管理、运维记录管理
完整:统一桌面管理、网络管理、设备管理、监测管理、流程管理、IM即时通讯……
协同:各个管理模块互联互通,相互写作
便捷:秉承傻瓜化操作原则
形成全方位完整的运维平台
■ 打造一个强大的沟通交流平台
运维做大部分时间是耗费在沟通上,寻找问题及解决方案,实际动手执行维修只占其一小部分
红珊瑚运维建立基于即时通讯消息传递的全新运维管理模式
人与设备、应用;人与人;应用管理模块之间
使用操作人员之间,操作用户与运维人员,信息中心人员与集成商、产品厂家之间
报警展示大屏,能够做到即时显示
用户报警即时传送到区域服务中心,即时展示
……
(此处应该用图展示)
■建设全新的运维模式生态链,共同做好系统的保障
引入引入ITSS、ITIL先进管理理念,提出互联网+运维概念,提出建立区域服务中心理念,在充分的安全保障下,将各种专业的高端技术人员集中,通过平台远程提供技术支持与运维管理,形成系统软硬厂家、集成商、运维服务商、应用软件商,共同为用户做好基础服务的运维生态链。
用户:得到更加快速、有效的运维服务,提前预警、快速定位、快速解决恢复;不用为基础运维操心、费心,把更多的时间、精力投入到业务流程的信息化。
运维商的效率更高,高端人员使用成本更有效率,从而获得更好的用户粘性
软件、硬件厂家得到更好的支持,好产品不会因为服务不到位而失去市场,安心做好产品。
推动中国社会的信息化步伐更快、更稳,进而推动中国社会的高速发展!!!
2 基础架构
3 产品功能与解决方案
3.1 建立统一、完整、智能化的基础信息配置管理
■ 统一定义的基础信息:机构、组织、人员、位置、通讯录
机构:集成商、运维服务商、软件厂家、硬件厂家的联系信息、组织信息、人员信息
组织:机构内的组织结构,是权限、设备、人员等信息的归类集
人员:内部使用操作人员、信息中心人员、外包运维服务人员、应用软件开发、实施等人员……
位置:统一定义位置的信息,运维人员可以快速查找设备、人员、部门所在,同时提供丰富的图片、文字备注,更加方便、快捷的找到
通讯录:通过电话快速定位科室、位置
■ 统一定义对象与类型:设备类型、服务类型、操作系统类型,形成应用为核心的运维对象管理
更好地定义需要管理的对象,并为监测、检测做好基础数据定义
形成以应用为中心的完整支持结构拓扑图:
应用由哪些服务组成
服务在哪个操作系统
操作系统运行在哪个物理服务器
物理服务接入哪个网络交换机的哪个端口。
■ 统一定义附属管理系统:供应商管理、资产管理、合同管理、运维管理等
对设备、应用系统等进行完善管理,避免不同的运维工具
智能匹配和判断
IP与MAC是否匹配、MAC附属的所有IP、设备接入网口是否发生变化、服务所在的操作系统、服务器是否发生变化、是否发现新的设备、服务、是否有的设备、服务不再使用?
当配置信息发生变更,系统能够自动检测,并给出智能提醒,由用户进行确认
提供接口为第三方应用系统、运维工具提供所有基础信息
3.2 网络管理
■ 高效、快速链路拓扑,做到对网络“知根知底”
自有拓扑算法,高效、全面、速度快、对系统影响小,即使在业务高峰期运行,也不会影响系统性能。
建立网内所有联网设备的链路关系图,包括设备所接入的交换机及其端口。
■IP地址管理
简化DHCP管理,傻瓜化操作
网络准入:黑白名单、限期访问、记录地址分配的人员、时间等信息
IP地址已分配资料自动备份到数据库
■ARP防范
通过客户机管理与网络管理的结合,有效防止客户机被ARP攻击,同时能快速定位出受感染计算机的网络接口
■ 交换机网络配置自动备份到数据库
定时自动备份,直接备份到数据库,也可以直接恢复到交换机里。
避免交换机发生故障后,难以快速找到交换机最新的配置文件,加快故障排除。
3.3 客户机管理
分为普通客户机上的客户端与管理人员的管理端
■ 强大的管理功能,管理人员的好助手
跨路由远程控制:
策略分发:对客户机的管理策略分发,实现对桌面功能的限制与管理,可以对
软件分发:
操作系统重装
USB管理
……
■方便、完备的客户端,成为操作人员的好工具
应用程序管理:每台电脑上的常用业务软件,系统重装后,无需重新定义;
软件仓库:让用户放心、便捷地下载软件使用;
通讯录:快速查找机构内的电话、科室、位置信息;
快速报修,便捷的任务评价;与内部人员便捷地即时沟通;
通知通告:让通知信息快速传遍到全部客户机;
■ 便捷的内置IM组件,建立所有人的沟通
便捷地与其它计算机、用户的沟通交流
管理人员和用户关于故障报修、出现问题的沟通交流,快速截屏传输
管理人员通过会话窗口,快速定位到管理界面
3.4 监测管理
■完备的监测方式
支持SNMP、WMI、ping等多种监测模式, SYSLOG、TRAP的主动报警解析与接收
■多样的报警条件判断,减少误判
单位时间内次数、单位时间内平均值,多条件组合报警;
根据设备应用重要级别差异化设置报警条件;
■便捷的报警设置
针对不同类型对象,系统内置多个报警参数、报警条件,并附有详尽的介绍,用户只需要指定相应监测时间频率、报警接收人即可,用户可以做到“零操作”
■报警信息自动转成报修任务
报警结构自动接入服务台与维保任务结合,自动生成报修任务
■丰富的报警展示与查询
网络拓扑、应用拓扑、服务功能展示
■报警的智能合并,避免人员空耗
针对设备的综合报警查询,同样设备、同样问题的报警进行汇总,避免同类问题多次处理,引起时间与人力资源损耗
■报警信息自动发到运维商的区域服务中心
针对对象类型建立监测参数、报警条件等信息,针对具体设备建立连接信息
3.5 基于IM的流程管理
■基于IM(类QQ群)的全闭环任务管理
用户便捷、快速报修
运维人员与用户通过即时通讯快速了解情况,截取用户计算机上错误信息
任务转交后,能看到前面所有的通话记录,避免重复咨询用户
同时定期在即时通讯里汇报进展,用户、管理人员能够了解任务的详细进度,
任务完成后,用户可以确认结束,并对任务进行评价。
■服务台
电话与计算机绑定,来电后立刻显示所在的科室及位置、历史报修信息
报修任务会即时在服务台提示,双击任务会直接进入会话界面,与报修人员沟通交流
支持任务快速查找,可根据不同类型的任务或相关的任务信息快速查找相关的任务;对
■便捷的任务管理界面,快速定位任务
任务详情、任务会话记录、处理进度及干系人一目了然。
3.6 强大的区域服务中心支持
■独立的区域服务中心版本
设立独立的区域服务中心版本,汇集各个被运维单位的资料,实现一个中心对多个单位的信息系统远程管理与服务。
基础运维信息备份:多个运维单位的基础信息备份
集中监控管理:各个运维单位的报警信息即时传送到区域服务中心,日志信息定期传送。
客户机远程原理:客户机的所有管理功能都能够跨路由远程实现,由区域服务中心人员统一管理,降低现场人员数量。同时可授权给软件商远程跟踪软件错误。
报修任务直接托管:可直接将运维任务发送到服务中心,统一进行远程维护、现场支持的调度安排。
设备远程调试:远程telnet登录调试、远程SNMP信息获取、远程CMD执行
■专家集中讨论,效率更高
建立区域运维中心,实现运维专家人力集中;故障问题涉及多方原因时,可协调相关多方专家集中会诊,便于问题快速定位处理。
■集团、行政划分的跨路由远程管理
红珊瑚所有管理功能都能支持跨路由的远程管理,对于集团、行政区域的信息系统实现统一管理。各个子单位网络一般相对隔离,跨路由与总部互联。红珊瑚运维平台不仅可以实现对各个跨路由的分部设备、服务、应用、客户机的全部系统的管理,还能在各个分部、总部之间搭建沟通交互的平台,提高分部与分部之间、分部与总部之间的沟通效率。
■强大的安全防护
用户级访问限制:可以限定哪些用户可以从外部访问、禁用用户、修改用户密码
物理设备层访问限制:限制哪些计算机可以远程访问
应用层协议层限制:全部为私有协议,没有内部数据结构,无法访问
网络层访问限制
1、接入IP地址限制,运维服务商的公网IP才能够访问
2、端口开放限制:由用户定义对外访问的五个端口号,可以关闭对外访问端口,在需要时再打开
4 运维案例与场景
4.1 运维覆盖范围
客户终端
网络运维
服务器、存储
系统软件
应用软件
4.2 案例
用户自行运维:
1、单一区域
2、分部、子公司模式
区域服务商运维