在数据中心设计层面,一个重要的趋势是提高功率密度。鉴于数据中心的空间限制,其需要更高效的运作,以应对电力需求和成本的上升,很明显,将每台机架投入更多的资源是一个非常实用的解决方案。但是,这一方案除了拥有其固有的好处之外,提高功率密度也为一些数据中心运营商带来了一些必须解决的问题和挑战。
功率密度的趋势
低功率密度往往等同于效率低下。如此宝贵的空间资源仅仅由如此少的IT设备资源所消耗,同时其还需要消耗更多的设备维护成本。位于圣克拉拉的高密度托管提供商Colovore公司的CFO兼联合创始人本·库格林指出:“当前,典型数据中心的客户部署的机架都是大约每台机架8–12千瓦的系列,虽然某些数据中心的密度要求更高,但接近20+千瓦的现象在大多数进行大数据分析处理的密集型应用程序来说仍然是罕见的。但与此同时,美国仍然有某些沿海地区的典型的数据中心的机架为4–5千瓦(而这还是10年前修订的标准)。”
在托管空间,只支持低功率密度的造价是非常昂贵的,因为全租用机架空间可能由于缺乏足够的电源而无法使用。尽管机架上装备了大量的设备,但托管空间的基础设施配套能力不匹配。“客户可以在他们现有的服务器基础设施上轻松地完成每台机架8-10千瓦的部署,但因为大多数数据中心设计建成的是仅支持4-5千瓦的,这样他们就必须跨机架实施半机架装备运行,否则就不能很好的实施冷却。但客户已经为全机架买单了,尽管其实只是用了半机架的负载资源。这无疑是一种浪费。”
对于功率密度最为明显的约束之一便是配电基础设施,公用电力公司提供的电源和数据中心的备用设施的水平都会影响到功率密度。对于公用电力公司所提供的每瓦的电力,数据中心必须有足够的UPS和柴油发电机,以便在停电的情况下继续保持其运营能力。当然,布线、配电单元(PDU)等提供电源给专用机架。库格林指出,“大多数的数据中心并没有太多的电力以供给给其设施,所以他们希望能够从公共电力公司获得更多的电力资源,并在数据中心的核心基础设施(电气和机械基础设施、发电机,配电设备等)上面花了很多钱。因此,对数据中心而言,获得更多的电力和成本问题是两个重要的变量。”
但也许数据中心面临的更为迫切的需要是冷却:设备每消耗一瓦的电力,就会产生一瓦的余热,必须除去,以保持数据中心所需的操作温度。这也是数据中心最初不打算将设备安置为更高密度所希望规避的最大的挑战。“当你数据中心机架层面的密度增加,服务器必然会生成更多的热量,因此更多的冷却也是必需的。”库格林说。“冷却基础设施是非常昂贵的,但最大的挑战可能来自于试图改造旧的数据中心。大多数这些旧的数据中心建设初期屋顶设得都很低,在许多情况下,实在没有简单的方法来提高密度。除了拆毁之外几乎没有什么方法,但这对于数据中心而言是非常难的,特别是当其还托管着某些客户的时候。”
不幸的是,对于传统的数据中心企业而言,将其数据中心改造成具备更高密度的数据中心意味着除了等待半导体摩尔定律带来的改进之外,其数据中心的设施没有多大实际潜力能够继续扩大计算能力了。但是,这种方法需要购买新的IT设备,更好的工艺技术,以及摩尔定律的不断进步,才能实现更高的效率,而这可能需要十年左右的时间。库格林指出,在这种情况下,“主机托管提供商只能简单地使用‘分散负载’,或迫使客户来跨半机架来使用他们的基础设施。但是,这显然是不可持续的,他们最终将随着客户服务器的刷新,耗尽他们的空间、电力、冷却资源。”
整合基础设施驱动更大的功率密度
向更高的密度的推进可以归纳为长期的基础设施整合:基本上,将更多计算机资源打包到更小体积,可以通过数据中心现有的趋势来实现,如采用虚拟化技术、刀片服务器和微服务器。整合基础设施“对于数据中心的运营效率有着非常积极的作用。”库格林说,“因为IT部署的物理尺寸较小,IT经理管理的权限更有限,而当服务器的数量减少了30-50%时,带给总功率的节约才会更有意义。”
这种方法旨在通过提升机架层面的电力,降低数据中心的总功率(其具有双重的好处,因为其同时也降低了冷却要求)。“其实,每一台服务器的电力需求大大增加,但总体而言,总功率是可以下降的,因为所需要的服务器数量更少了。这便是高密度数据中心为何变得如此重要的原因了,他们是让一切基础设施得以整合的关键。今天的服务器可以轻松地实现每台机架单元达到500瓦到1千瓦!”
高密度带来的散热问题
当然,通过高密度可以带来更高的效率,每台机架均安置了尽可能多的设备,从而帮助数据中心实现尽可能的节省成本、占地空间和解决管理难题。但好东西都是需要权衡的:在这种情况下,会造成冷却问题。低密度部署通常是采用空气冷却,并且,在大部分地区,都是采用免费的室外空气冷却的方法。但随着数据中心功率密度的上升,空气冷却变得令人望而却步,而且会变得造价昂贵。
较之均匀分布的直接冷却源,产热的解决方案更类似于提供点源:产热的究竟是由于机架、服务器、甚至处理器的级别。“服务器芯片级的处理能力似乎在持续增加,但在某些时候,他们将需要内部冷却,立即在服务器附近实施冷却,以防止产生的热量增加太多。”因此仅仅对一个点采用空气冷却可能仍然不够,需要采用水资源(或其它液体)提供更大的冷却能力,但是,这需要牺牲掉一部分的基础设施交付能力,提升执行上也存在一定的困难,如实现冷却水与设备电子元件的严格隔离。
部署一个基于水的冷却方案可能会导致某些问题,特别是对于老旧的数据中心而言尤其如此,必须改造现有的基础设施。但对于那些能够支持不断增长的功率密度的新设施而言,水冷却的方案能够将冷却能力输送到任何需要的地方,而不是仅仅试图让整个房间保持足够低的温度,以确保服务器空间整体运行温度。诸如热通道/冷通道的方案可以让冷却空气有一些回旋的余地,但这种方案也有其局限性。最后,随着数据中心高密度要求的不断提升,浸泡技术可能会成为必要的技术。现在已经有一些公司在提供这方面的产品,包括不导电的流体,以及将冷却液体输入服务器机箱。
高密度的回报
对于客户,无论他们是托管服务的客户,或者就是数据中心运营商,高密度在在总拥有成本(TCO)方面能够为他们提供重要且丰厚的利润回报。库格林说,“当一家公司可以整合其IT基础设施到虚拟化的刀片服务器,其可以立马节省20%至30%以上的经营成本,以及每台机架4-5千瓦的遗留部署。这在很大程度上是由于节省了每月机柜需要容纳服务器所消耗的电力费用,以及降低了交叉连接和顶级机架交换机的成本。”对于托管服务客户和数据中心运营商,这意味着进一步扩大了现有机架的可用空间,卖弄去了构建新的数据中心的麻烦和费用,其收益绝不仅仅是直接的成本节约。
对于那些想要继续保持其旧有的数据中心建筑或走托管路线的企业而言,随着能源价格上涨和IT服务需求的增长,他们需要提高效率和节省地面和机架空间。因此,数据中心实施高密度功率是一大趋势,但同时也是一项挑战:将更多的容量打包到机架需要建设相关的配电设备,备份基础设施、冷却能力也需要提供相关的部署支持,以保持管理操作温度。虽然冷却液的方法目前可能还不是一个较为普遍的趋势,但随着空气冷却方法在高密度环境开始逐渐变得不太实用和实惠,其会变得更加普遍。然而,无论从空气冷却过度到液体冷却方法需要多久的时间,数据中心功率密度无疑将继续攀升,因为企业都在试图最大限度地利用自己的资源。