第一章 总则
1、为科学、规范地管理数据中心机房,保障数据中心内业务系统安全、稳定运行,促进数据中心中心的业务开展,提高运维管理水平,制定本管理制度。
第二章 出入管理
1、进出机房人员应严格遵守《机房人员进出制度》。
2、进出机房设备应严格遵守《机房设备进出制度》。
第三章 运维团队管理
1、运维技术人员是数据中心机房管理的核心力量,要通过制度的建立和实施,培养一支技术扎实、具备实际操作能力的运维队伍。
2、运维团队人员须经严格培训,考核合格后方可上岗,并且不得单独承担值班工作和相关独立操作。
3、定期针对不同专业开展专项培训工作,提升整个团队的运维管理能力水平,确保机房运维管理工作的质量。
第四章 机房设备管理
1、机房的市电输入、配电柜、照明系统、UPS电源、柴油发电机等动力系统的日常运维由数据中心专门人员负责,特殊情况可请上级单位配合完成。
2、机房空调及新风系统由数据中心专门人员负责运维。
3、机房消防系统由数据中心专门人员负责运维管理。
4、门禁系统、保安监控系统由数据中心专门人员进行日常运维工作。
5、机房内的路由器、交换机、服务器等设备,如果属于合作协议约定范围内的设备,则按照协议规定的责任方承担运维责任,其它设备由数据中心统一运维。
6、以上设备的由原厂商或其代理商提供售后维保工作,数据中心负责售后维保协议的有效性。
7、设备的命名、线缆标签的制作等均应符合相关规定,并与现场设备保持一致。
第五章 值班管理
1、值班人员应具有认真、负责的工作态度和科学、细致的工作作风,按时上、下班,坚守岗位。
2、遵守各项规章制度,按照值班工作流程(巡检表),监视各系统运行状况,出现异常情况,按规定立即上报。
3、值班人员必须认真、如实、详细填写《机房日志》等各种登记薄,以备后查。
第六章 运维管理
1、日常运维工作按照《数据中心运维服务管理方案》进行。
2、编制月/季/年度运维管理的作业计划并执行。
3、运维人员进行日常维护操作必须按照《设备使用手册》和《操作指南》进行,非日常操作内容需报主管人员批准后进行。
4、所有的操作实行双人作业制度,并形成详细的操作记录。
5、系统运行过程中出现的故障事件,按照《故障处理流程》进行处理。
6、运维主管人员应定期和不定期对相关制度的执行情况进行检查,并作为运维人员的考核依据。
7、对基础维护数据报表进行深入分析与多向比对,从核心技术层面对维护工作进行优化,提高维护工作的效率,严格把控维护工作质量。
第七章 文档管理
1、应安排专人负责文档管理工作,监督、促进文档管理规定的有效执行。
2、做好设备资料、图纸、维护巡检记录、维修记录、设备运行参数等资料的归档、整理、保存工作。
3、各设备和系统的实施文档和用户文档(包含电子版)应双份保存,并更加运维需要编写操作指南。
4、值班日志和操作记录每周进行归档处理,要求附带运维主管总结说明文字。
故障事件处理完毕后归档,每月进行统计整理工作,建立知识库。
第八章 安全管理
1、严格遵守《机房安全制度》。
2、值班人员随时监控中心设备运行状况,发现异常情况应立即通知责任人进行操作,并及时上报和详细记录。
3、非机房工作人员未经许可不得擅自上机操作和对运行设备及各种配置进行更改。
4、严格按规章制度要求做好各种数据、文件的备份工作。重要数据资料要定期进行双备份,并严格实行异地存放、专人保管。所有重要文档定期整理装订,专人保管,以备后查。
第九章 保密管理
1、机房所有工作人员应遵守公司的保密规定,不得擅自泄露机房各种信息资料与数据。
2、处理涉密数据的计算机和软件程序要采取加密措施。
3、涉密信息只能通过加密通道传送,废弃的加密资料必须销毁,不得随意丢弃。
4、严格执行密码管理规定,对操作密码定期更改,超级用户密码由系统管理员掌握。
5、机房责任人应对保密工作负责,检查保密工作的落实执行情况。
6、如对机房内监控数据、视频录像等内容因涉密等原因需要销毁的,需向部门主管领导发电子邮件进行申请,经批准后方可销毁。
第十章 环境卫生管理
1、机房内部卫生定期进行清理。
2、机房应配备专用工作服和专用鞋,并经常清洗。
3、无论机房工作人员还是经允许进入机房的人员,进入机房必须更换专用拖鞋或使用鞋套。
4、每周对门、窗的密封性进行检查,发现问题及时解决。
5、每年对机房环境卫生情况进行年终检查评估,找出问题,制定整改措施。
第11章 消防管理
1、机房消防设施应定期检查和更换,以保证其有效性。
2、机房内严禁吸烟、喝水、吃食物、嬉戏和进行剧烈运动,在夏季空调开放期间,应经常检查冷凝水管和窗户,以防水流入机房。
3、机房内不得堆放易燃易爆品,如:纸箱和废纸等。
4、机房电源和插座为机房设备专用,非机房设备不得使用。
5、机房内不得存放食品,要检查有无老鼠,一旦发现,立即采取措施。
6、机房内一旦发生火情,立即采取措施,并马上报警。
7、安全消防关系机房人员的安全,必须严格遵守规定。违反规定造成后果的要严加追查,严肃处理;对于严格管理避免重大事故的,要予以表彰和物质奖励。
第12章 应急管理
1、机房设备和系统的应急预案,保证应急事件发生时有序、高效执行。
2、建立应急事件演练制度,保证应急预案处于可用状态。
3、建立应急物品专门储备、专人管理,应急外围资源随时更新,以及紧急启用的审批流程。
第13章 解释与执行
1、本制度由数据中心运维管理部门制定、解释和修改。
2、本制度自发布之日起执行。