数据中心作为信息与信息系统的物理载体,目前主要用于与IT相关的主机、网络、存储等设备和资源的存放、管理。只有运维好一个数据中心,才能发挥数据中心的作用,使之能更好地为业务部门提供强大的支持能力。本文从数据中心运维管理的目标、对象及要求三方面对其进行概括阐述。
运维目标
从数据中心角度来看,数据中心运维管理就是:为提供符合要求的信息系统服务,而对与该信息系统服务有关的数据中心各项管理对象进行系统的计划、组织、协调与控制,是信息系统服务有关各项管理工作的总称。数据中心运维是数据中心生命周期中最后一个、也是历时最长的一个阶段。所谓生产运维期指的是从数据中心项目交付使用,直到项目废除的全过程,也就是项目进行生产运维活动,收回投资,以实现预期投资目标的周期。在此阶段的运维管理,将依托于数据中心已交付的基础设施,通过科学的管理,最终使数据中心得以实现服务与经济上的目标。简单地说,运维管理就是用好、管好已建设交付的数据中心。因此,在数据中心生命周期中,运维管理主要肩负起以下重要目标:合规性、可用性、经济性、服务性四大目标。
1、合规性
合规性,要求数据中心在运维管理过程中能避免违反任何法律、法规、标准与合约文件等规定。这里要求数据中心在运维管理的管理框架设计与执行全过程(包括人员使用、流程设计、产品部署与厂商管理等),能充分考虑有关文件的要求,并在运维管理过程中留下相应的记录,建立起相应的管理评估机制,以向利益相关方证明其能达到合规性的目标。
2、可用性
可用性,要求数据中心在运维管理过程中能保证数据中心各功能组件保持支持既定功能的能力。这里要求数据中心在运维管理过程中能准确识别相关功能组件,了解该组件的设计能力,定义与该组件技术特点相匹配的监控指标,并通过主动与被动的管理,最大限度地保证数据中心各管理组件的可用性。
3、经济性
经济性,要求数据中心在整个运维管理周期中实现数据中心预先要求的财务目标。这里要求数据中心在运维管理过程中,要建立IT财务机制,一方面通过合理的财务预算、会计、成本分析等手段准确、及时地分析、记录运维管理过程中的各项支出;另一方面要制定相应的计价模式,将数据中心运维过程中的成本合理地分摊。此外,要通过财务管理,使数据中心在运维管理上实现成本与其他管理目标的相对平衡。
4、服务性
服务性,指数据中心应建立服务导向型的运维管理框架。要从服务的角度出发,分析客户与数据中心的各种交互界面,以此为源头构建各种管理流程,最终形成整体管理框架。比如,数据中心在管理体系的设计上可以参考ITSM(IT服务管理体系)的要求,建立服务台、服务水平管理、业务关系管理等流程,以此来驱动后台运维管理工作。
运维对象
如前所述,数据中心的运维管理指的是与数据中心信息服务相关的管理工作的总称。因此,在探索数据中心运维管理方式之前,必须要理清数据中心的运维对象,才能针对数据中心特定的运维对象建立相应的管理模式。数据中心运维对象共分成5类。
第一类运维对象是基础设施部分。这里主要指为保障数据中心所管理IT设备正常运行所必需的网络通信、电力资源、环境资源等。这部分设备对于客户来说几乎是透明的,因为大多数客户基本上只关注业务,并不会关注到数据中心的风火水电。但是,这类设备如发生意外,对依托于该基础设施的IT应用来说,却是致命的。基础设施部分的主要内容包括:供电设施、环境设施、安防消防、网络与其他。
第二类运维对象是在提供IT服务过程中所应用的各种IT设备,包括存储、服务器、网络设备、安全设备等硬件资源。这类设备在向用户提供IT服务过程中提供了计算、存储与通信等功能,是IT服务最直接的物理载体。
第三类运维对象是系统与数据,包括操作系统、数据库、中间件、应用程序等软件资源;还有业务数据、配置文件、日志等各类数据。这类管理对象虽然不像前两类管理对象那样“看得见、摸得着”,但却是IT服务的逻辑载体。
第四类运维对象是管理工具,包括了基础设施监控软件、IT监控软件、工作流管理平台、报表平台、短信平台等。这类管理对象是帮助管理主体更高效地管理数据中心内各种管理对象,并在管理活动中承担起部分管理功能的软硬件设施。通过这些工具,可以直观感受并考证到数据中心如何管理好与其IT直接相关的资源,从而间接地提升IT的可用性与可靠性。
第五类运维对象是人员,包括了数据中心的技术人员、IT运维人员、管理人员以及提供服务的厂商人员。人员一方面作为管理的主体负责管理数据中心运维对象,另一方面也作为管理对象,支持IT的运行。这类对象与其他运维对象不同,具有很强的主观能动性,其管理的好坏将直接影响到整个运维管理体系,而不仅仅是运维对象本身。所以,下文将有专门章节探讨对人员的管理。
运维要求
由于数据中心运维对象涉及种类比较多,从供配电设施到IT设备、到应用系统、到各类人员,这无疑要求数据中心的运维管理应能适应上述所有的管理对象。另外,作为IT服务的物理载体,客户对IT服务实时性、安全性、可靠性等的要求最终将内化为对数据中心运维管理的要求。最后,如果该数据中心要通过一些专业认证,或为一些特殊行业提供IT服务,其运维管理必须符合相关标准与行业规范。以下列举了部分运维管理方面的要求。
1、信息安全的要求
随着技术的广泛应用与信息的转型,信息对机构来说,已经变得与土地、人力与资金等传统资源同等重要。另外,随着信息面临的威胁逐年增加,如病毒、钓鱼网站、间谍软件、错误操作、越权使用、人员安全等,作为承载客户信息系统运行的数据中心而言,信息安全绝对是其运维管理的重要要求。
2、运维管理服务化的要求
随着客户对IT系统依赖程度的增加,数据中心的工作质量将直接影响到客户的业务、市场甚至是公司形象等。由于信息系统宕机导致企业一天遭受数千万元的损失,甚至被监管机构处罚的例子屡见不鲜。这个变化使得数据中心的运维管理逐渐浮出水面,数据中心运维管理团队已从原来的机房管理者演变成了IT服务的提供者。如何定义数据中心工作与服务的关系,如何建立与客户之间的服务水平协议,如何快速地支持客户业务的IT服务需求,如何规划好IT系统建设更好地为业务部门提供发展的动力等,均成为数据中心运维管理规划过程中不可或缺的一部分。
3、全面质量管理的要求
数据中心运维管理的目标之一就是要保障用户IT服务的按质提供,该目标又可细分成基础设施的可用性、IT设备的可用性、配置管理的有效性、人员对设备操作的熟练程度、服务商管理的到位程度等多个方面。由于数据中心与制造企业不同,上述服务性的工作毕竟无法像工业产品那样容易衡量质量,而且就算是在检查的时候服务质量是合格的,也无法确保在需要该服务时服务质量也是合格的。因此,如何做好全面的质量管理是数据中心运维管理的主要内容。
4、管理制度体系化的要求
数据中心作为一个新生事物,对其运维管理也是近年才兴起的一门学科。因此数据中心的运维管理制度主要靠运维人员利用以往的经验,并总结数据中心管理过程中的经验教训而逐渐建立起来的。这样的管理制度能满足一定的管理要求,但由于没有一个标准的指导,而且在搭建初期主要遵循从下而上的方式,从而导致整个制度的体系化不足。这种体系化不足的缺陷会导致企业管理出现零散化,也就是当组织面临一个新的工作或管理要求时就会产生一个新的制度,而该制度与原有制度之间的关系则难以进行整合,最终会使管理者无所适从。
5、管理制度测量的要求
随着IT技术应用的广泛和深入,以及精细化管理的提出,量化管理已成为许多成熟企业努力的方向。作为直接支撑IT服务的数据中心来说,也需要导入这种量化的管理方式,用数字来说话。这就要求数据中心在构建运维管理体系时,要考虑将来的测量需求,并在流程中预留这些测量点,最后通过报表、记录的输出,达到对该制度进行测量的要求。