一、 总则:
1、所有工作时间分为3个阶段:搬迁前,搬迁中,搬迁后
搬迁前:服务器在老机房运行阶段
搬迁中:老机房停止服务,下架,运输到新机房阶段
搬迁后:服务器运送到新机房
2、整个搬迁过程需考虑如下几个方面:
机柜空间,网络,硬件设备、操作系统、数据完整性,基础服务,项目应用,搬迁流程
机柜空间:新旧机房机柜空间大小不同,需提前安排好服务器放置位置
网络:老机房有4个网段,需全部正确切换到新机房,并对应上服务器所需网段,线上内网环境应保证不用任何改动,所有服务器上线后网络自然接通
硬件设备:交换机、路由器、服务器硬件本身,存储设备,应保证正常启动,防止配置丢失导致启动后重新配置等问题
操作系统:需提前做好检测,防止操作系统不能启动
数据完整性:需要保证数据完整,防止误操作、物理损坏等造成数据丢失
基础服务:vpn,文件服务器等影响全局的基础服务,需保证可以首先并正确启动
项目应用:需保证项目按照相应顺序以此正常启动,主要要确保数据库,缓存,消息队列等基础服务先启动后,再启动项目
搬迁流程:整个搬迁流程应责任到每个人,明确责任,尽量简化人为操作,防止人为造成损失
二、 搬迁前准备工作
1、 老机房工作
去老机房统计所有设备型号,U数 统计并确认所有机柜外网段使用情况,统计网络设备位置信息,使用情况等保证硬件设备标签完整、正确、识别性高
根据上述信息,对所有硬件设备新增标签,注明搬迁责任人、网卡使用情况、新机房机柜号等内容,便于搬迁时高效无误的工作
2、 新机房工作
运维所有员工逐次到新机房熟悉地形,防止因不熟悉地形,忙中出错 所有机柜提前做好网线、电源线的准备工作,内网外网用不同颜色成品线区分,做到易识别
临时交换机上架,测试网络连通性 测试每根网线连通性,每根电线连通性,保证上架时不是这些基础小问题延误工作 机柜贴标示,再次注明机柜同服务器关系,避免上架时混乱
3、 远程工作
统计所有nfs挂载情况,提前做好启动自动挂载
做好数据库备份方案,各个项目主库不能启动应急方案 做好文件备份方案,提前备份nfs上项目文件
做好基础服务替代方案,配置好替换路由器等,防止线上路由器损坏
所有应用、系统做好关停脚本 所有应用、系统做好启动脚本 测试脚本使用效果,保证可靠性
三、 搬迁过程中
1、 老机房
提前到机房,每个人确认负责服务器器,并熟悉位置
确认每项前期准备工作是否已经到位
凌晨一点,按照关闭顺序,每个人登陆负责服务器执行关停脚本,关停所负责服务器
通知机房技术人员,切换网络到新机房,并由负责人测试新机房网络连通效果,确保新机房网络正常
正常关闭并断电后,下架服务器按照顺序搬到楼下运输车上
2、 运输过程中
数据库服务器采用防震泡沫缠绕后装车
每个人负责自己的服务器不受大的震动,防止由于大震动导致服务器故障,不能启动
到新机房楼下,按照先后顺序,依次进入新机房,原则上数据库服务器和基础服务服务器先进机房
3、 搬迁到新机房后
每个人按照事先标识好的标签上面的内容上架,接通网络,接通电源 首先保证所有数据库启动,并检查主从状态等 剩余服务器确认电源、网络都插好后,加电启动
所有服务器启动后,观察机柜电流表是否有超电现象
有超电现象的机柜和无超电现象服务器调换位置,进行电力平衡
每个人登陆自己负责服务器,执行启动脚本,依次启动虚机,项目应用等 测试访问情况
访问没有问题以后,给测试人员打电话,走功能测试流程 通过后,结束等待访问量上升后无问题,离开