当AI不再仅仅存在于科幻电影和小说里的时候,当人工智能不再仅仅只有人工,没有智能的时候,当无人驾驶、AI工程师、AlphaGo战胜棋手柯洁和李世石等人工智能(AI)的新闻报道铺天盖地而来的时候,我们才真正意识到,AI正在掀起一场新的革命,革命的力度和深度将不亚于当年的蒸汽机、电气、以及互联网信息技术。
麦肯锡全球研究院在最新发布的分析中也提到, AI对全球GDP的增长贡献将达到1.2%,在2030年人工智能将为全球经济活动带来13万亿美元的额外增长,它的贡献率不亚于蒸汽机。该分析同时表明,未来十年内全世界将有大约70%的公司至少使用一种AI技术,超过50%的公司将会应用全部的AI技术。AI技术将作为一种构建万物智能互联世界的通用技术,全面影响人类的经济与生活,诸如无人驾驶、人脸识别、智能音箱等应用将会融入到日常生活之中。
基于此,我们可以预见,AI将成为第四次工业革命的核心驱动力,它牵引并加速世界发生深刻且颠覆性的变化。
但是AI引起的变化,尤其是智能变革并不会凭空出现,一方面它只有与各行各业以及价值链的各个环节进行深度融合,才能发挥最大效用;另一方面AI自身的发展也需要强大的基础设施来支撑。这里的基础设施并不单指算法、数据和计算力等核心要素,也包括作为AI技术生根发芽的土壤——信息与通信技术(ICT)基础设施,尤其是作为底层设施的数据中心基础设施。
在工业4.0时代,数据中心已经成为企业生产和管理系统的关键组成部分,并且在上升成为一个可以提升企业竞争力的有效工具。基于此,在AI 全面浸润人类生活之际,我们要抓住AI赋予的机遇,将数据中心基础设施价值最大化,反之,更强大的数据中心基础设施可对AI进行反哺,将AI应用推向极致,两者相得益彰、相辅相成。
抓住AI赋予的机遇,使能数据基础设施价值最大化
我们不禁要问,AI赋予数据中心的机遇究竟是什么?利用机遇我们能做什么?或许我们可以从以下三点看出端倪。
重点机遇1:主动预防,数据中心做到更安全可靠
安全运行对数据中心的重要性不言而喻,保证数据中心高可靠运行是对数据中心的核心诉求。业界AI技术在提升数据中心可靠性和可用性方面已经有一些实践,例如收集供配电系统设备信息,对即将发生故障的设备和部件提前发出预警,为运维人员运维活动提供决策支撑,但是如何利用机器的自我学习能力,做到供配电系统整体运行的安全可靠,是我们要思考的重点问题。要实现更高程度的智能化以及主动避错,这对AI技术应用或许是个很好的契机。
华为对数据中心智能化进行深入研究,融入AI性能的iPower技术可提升数据中心可用性,借助智能化硬件,实现智能故障定位与预警管理,引入大数据技术,智能分析每日海量的运维数据,识别机房潜在隐患,保障数据中心的可靠运行。
iPower智能供配电技术以模块化UPS为核心,主要通过供电全链路监测、预警和故障自动隔离等手段,提高数据中心能源基础设施可用性,继而通过AI技术的应用,最终实现预测性维护。
iPower通过供电全链路监测,可实现毫秒级的故障检测,毫秒级的故障隔离,分钟级的故障恢复,可消除火灾隐患,大大提高数据中心能源基础设施可靠性和可用性;
以电池管理为例,在预防电池失效方面,iPower通过AI技术,可以精确预测电池的寿命和健康度,为用户提前提供维护决策依据,及时排除有失效隐患的电池组,变事后补救为事前预防,变被动响应为主动维护,大大提高数据中心供配电安全等级。华为的模块化UPS结合iPower技术,可以在电池出现温度快速升高等极端情况下,自动切断该组电池,从而避免出现起火等恶性事件。
重点机遇2:智能营维,数据中心做到更自动高效
数据中心传统的维护方法是靠人,而靠人维护,失误率大、漏错率高、失效排查时间长,小小的人为失误会对数据中心造成极大的损失。传统运维方式无法解决人为误操作带来的业务中断问题。
融入AI性能的 iManager,可看作是数据中心的大脑,借助智能化硬件和传感器,实现精准感知。通过自动化手段,逐步减少人工巡检等例行重复性工作,池化专家资源和能力,并固化于运维流程中。再加上全流程的电子运维,包括巡检的操作、维保的操作、应急演练的操作,把所有的流程以及操作指导全部做到线上,实现了运维质量从原来靠人的责任心到现在靠流程管理的转变。通过全流程电子化的运维跟踪,量化原来没有办法量化的信息,比如通过电子运维提升巡检的执行力和运维活动的质量、实现故障的预测等。这将大幅提高人均运维效率和运维水平,提升数据中心的可靠性。
此外,在市场出现了越来越多由边缘计算产生的边缘数据中心机房,就近提供服务和处理计算。面对日益增长的边缘数据中心数量,分行、支行、网点等数据中心无法统一集中管理,数据中心故障响应速度慢,运维效率低等挑战。
华为iManager全网管理功能,实现对多网点数据中心基础设施进行集中监控,统一管理,实现预防性维护,通过GIS定位技术提高故障定位响应速度,提升数据中心运维效率;移动APP监控,从内到外简化管理,轻松知晓海量网点数据中心运行情况,摆脱传统人工的运维检修方式,降低维护下站次数和节省开支,让数据中心管理变得更加简单、高效。
在运营方面,管理好数据中心资产也尤为重要。华为iManager还能对资产进行盘查,保证设备的完整性,保护重要数据。另外,还可以对资产匹配最适宜的供电、制冷、空间、带宽等资源,实现资源的最佳利用,利用AI技术,可协助对资产上下架和运营进行智能化的管理,提升运营效率和效益。
重点机遇3:降耗增效,数据中心做到更绿色节能
能耗问题一直是数据中心关注的焦点,传统数据中心年平均PUE高于1.8,随着越来越多AI应用的落地,业界对高速计算的需求日渐增多,GPU计算服务器的规模和需求将持续增长,加速计算服务器产生的热能是传统CPU的数倍,如何解决服务器的散热问题将是未来的重要考量。目前已有的智能DC节能技术可以通过传感器获取关键节点数据,进而优化所有系统和设备的整体能耗,降低PUE。
而AI能否深入数据中心内核,带来更低PUE?华为作为ICT行业的领导者,在数据中心热管理技术方面走在行业前端,致力于带给客户更低的PUE。华为将基于AI的iCooling智能热管理解决方案融入数据中心基础设施,针对数据中心制冷效率提升瓶颈,通过深度学习,打通精密空调末端、冷水机组、冷却塔、水泵等制冷系统以及IT负载、环境变量等大数据之间的联动,对大量的历史数据进行分析,探索影响能耗的关键因素,获取PUE的预测模型。利用寻优算法,获取调优参数组,下发到控制系统,实现制冷系统的最优控制。最终通过规范化的实践引导和目标导向评测,不断调整优化,获取最佳PUE。
创新技术联接绿色未来
华为作为全球领先的ICT解决方案供应商,在关注业务发展的同时,更加关注运营的可持续性,致力于为社会的可持续发展做出贡献,助力建设绿色智能的全联接世界。根据华为GIV2025产业愿景报告,预计到2025年,通过ICT及基础设施节能技术的持续创新,全球ICT行业平均到每联接的碳排放量有望降至15kg,比2015年(75kg)下降80%。数据中心基础设施作为全联接世界基础的基础,通过融合AI、电力电子技术、热力学技术、数字信息技术、通信技术与物联网等创新性技术,可以获得更好的能效指标,以此促进环境的持续改善。目前华为已在全球部署了800+大型数据中心,提供低PUE的数据中心能源解决方案,减少耗电量和碳排放。