日前,在谷歌官方网站上,谷歌宣称自家的数据中心电力使用效(PUE, Power Usage Effectiveness)全球平均值为1.12。并声称这一数据原本可以降低至1.06,只是因为考虑到机房整体的能源消耗,包括线路、变压器等所有能源消耗内容,才保持1.12这一“保守”的指标。相比全球范围内机房平均PUE值仍在1.7左右挣扎的水平,即使考虑数值计算上的偏差,谷歌这一优势仍然划时代性的,值得研究与学习。考虑到数据中心已然成为全世界最大的耗能行业(约占全球能耗的1.5%~2%)之一,降低其PUE值对全世界能源行业都有举足轻重的作用。在谷歌官方的《Efficiency: How others can do it》中,也对自家数据中心的节能策略进行了部分宣传与介绍。
二、基础概念
数据中心守护着企业重要 IT 设备的运行,如服务器、网络设备以及存储设备等,在数据中心支持全球数十亿人口上网的同时,也产生大量的机房能耗, 研究具体的机房能效改善对策,才能真正实现节能。对于当前的数据中心管理者来说,必须采用高效率的机房经营方针,才能取得“环保”及 “经济”双赢的好处。而提升数据中心能源效率的第一步,便是审慎评估PUE。
简单来说,PUE 就是数据中心总电力除以主能耗设备(即IT系统)电力,或是总设施能源除以 IT 设备能源。由于在相同产品与技术水平下IT系统的能耗水平基本相似,PUE便自然成为了检验机房能源效率的重要指标。根据 Uptime Institute 于的调查研究显示,全球业界平均 PUE 为 1.7,这表示机房节能仍有改善空间。
受到近年来大数据、物联网浪潮的推动,各地的机房建设持续进行,同时, 在环保意识高涨的氛围下,“机房节能”也成为了一门新的研究领域。从客观事 实来看,首先,数据中心的电力支出占总持有成本(TCO, Total Cost of Ownership)的一大部分,接近或超过人力成本;其次,数据中心常背负着“不环保”的恶名。
截至目前为止,仍有许多数据中心尚未采用任何效率指标,导致数据中心的节能毫无标准可循。虽然 PUE 仍存有许多争议,但是 PUE 值仍是衡量数据 中心基础设施效率的主要指导方针,而且对于拟定及执行数据中心的绿色节能 策略也很有参考价值。
三、谷歌数据中心节能策略
IT 设备如:服务器、存储设备、通讯技术、基础设施 (风扇、冷却、水泵、配电等),其本身的效率以及碳排放,是影响数据中心产生温室气体的主要因素。如果专注于能耗改善的部分,将可对数据中心的绿色节能计划产生显著的影响。
在谷歌公开的节能策略中,以下几部分对于改善数据中心能耗,并 优化PUE有着显著作用:
一:定期进行硬件检查
数据中心普遍存在许多不必要的 IT 设备,所谓“休眠的服务器”指的是仍 然插在机柜里,实际上却已不再使用的服务器,但是会占据宝贵的机柜空间,消耗大量能源,并且使 PUE 恶化。为了了解此问题的普遍性,一项相关调查发现,大约有半数的被调查者并未执行计划性的检查及拔除多余的服务器。此外,在研究中,大部分机房的现场并无法准确地监控所有基础设施及 IT 负载,可见机房节能改善之路还很长。
除了 IT 设备的检查,对于非 IT 的基础设施,也必须做定期的检核,例如机房的不间断电源系统(UPS),有别于传统的工频单机 UPS,当前的趋势是采用高频模块化 UPS,为了达到机房节能,选用 UPS 时应该考虑以下两大条件: 1. 随需扩容:模块化 UPS 可以配合机房扩容的脚步,适时增加电源模块的数量,不需要在机房建置初期投入大量的资金,并且不占据多余的机房空间,使机房业务逐步成长时,UPS 电源仍可“无缝接轨”;除了增 加电源模块,UPS 也必须满足多机并联的需求,以因应机房规模扩大。模块化 UPS 满足机房无缝扩容的需求。2. 轻载高效:一般数据中心为了确保可靠度,会配置电源冗余 N+X,甚至 配置 2N 双母线,导致负载率大约在 30-40%甚至更低,因此除了追求 UPS 满载效率之外,也要关 注 20-100%负载率区间的效率曲线,设法达到“轻载高效”的理 想境界。
二:例行测量 PUE 值
如前所述,PUE 是量化能源效率的主要业界标准,大部分原因是其具有简单性及可行性,但是在观察的几个行业中却很少实施。不定期的纪录并无法确 实了解实际的能源使用状况,所以业内人士不断建议执行例行性的 PUE 检测, 以便监测数据中心 PUE 随季节变化及其他因素而波动。此外,为了能实时精确 量测总电力,并纪录实际的 PUE,必须在关键测量点安装传感器,并记录实际 电力(kW 及 kVA),并且应该要记录一段时期之内的能源使用状况,才能做出最 佳的分析。谷歌对其全球机房均进行详细而准确的记录与对比,这也是其效率得以提升的关键之一。
三:更新硬件
服务器效率与 PUE 直接相关,而且是提升 PUE 的关键要素,但是想要正 确估计服务器效率,还必须考虑几个因素。我们可以从 CPU 利用率出发,针对能效不佳的 CPU,虚拟化技术(virtualization)可以大幅提升 CPU 能效及服务器的效率,而不需要更新服务器;此外,也应该将每一只机柜的负载能力与消耗 电力,列入效率的计算中。采用刀片服务器(blade servers)是提高机柜密度 的一种手法(每一机柜最多可容纳 1,024 CPU 核心),也可以降低设施的冷却与电力需求。
将实体服务器合并与虚拟化,将可提高数据中心效率,IT 管理人员应该在 硬件升级时将此列入考虑。根据研究指出,合并服务器的好处有:
平均每年每一服务器最多可节省约4000元
减少热量的产生及相关的冷却成本
释出多余空间并扩大运算能力
值得注意的是,虚拟化技术及刀片服务器会产生一个负面影响,亦即会产生额外的热量及冷却需求。目前有数种解决方案,例如“冷热通道封闭”或是“机 柜式空调(列间空调)”等气流管理手段,就是为了处理机房高密度负载的问题。
四:提升机房冷却效率
冷却是仅次于 IT 负载之外,最大的耗电来源,因此,安装能源监控及测量机制非常重要,可以了解冷却对于 PUE 的整体影响与改善的方法。
谷歌作为数据中心节能领域的佼佼者,领先的关键点也集中在机房冷却效率方面。根据Android Emotions 报导,最新的谷歌 AI 产品正在尝试找出能进一步降低 PUE 的方法。
谷歌更用来提升机房冷却效率有关的做法包括:
1、 优化气流管理 设计良好的冷热通道封闭,可避免热空气和冷空气混合,以提升冷却系统的效率。为了有效排除机房热点,建立理想的热能分布状态,可以借由适当地放置温度传感器,利用计算机仿真工具找出热点并加以排除。根 据 EPA 的研究,有效的冷热信道封闭系统,可减少 25%的风扇能耗,以及 20%的冰水主机能耗。
2、 提高机房环境温度
谷歌已打破了数据中心必须保持约摄氏 21°C的迷信,确认了冷通道可以在约摄氏 27°C的温度下运转,因此在提高温度的同时,关闭再热器和除湿机,便可以有效节约能源。
3、 采用自然冷却技术(Free Cooling)
空调系统的冰水主机会消耗大量的能源,可以视天候条件,选用自然 冷却系统,将外面的冷空气吸进来,加以利用后再排放到外面去。其他自然冷却的来源包括:引入外界的空气、水蒸气或设置大型的热储存器。
五:提高机房温度
长久以来,机房 IT 人员受限于传统机房温度迷信。不太愿意提高机房温度,然而,美国空调冷冻工程师学会(ASHRAE)发布的机房工作温度建议,范围修订为 18°C至 27°C(64.4°F 至 80.6°F)。
除了温度,ASHRAE 也提高了湿度建议范围。受惠于这样的修订,数据中心将可以创造更多冷却成本的节约,也更能符合自然冷却的条件。
就机房温度而言,如果太过保守,维持机房低温,将会使营运成本居高不 下,造成 PUE 值较差或冷却成本较高;此外,根据英特尔一项研究数据显示,机房环境温度每提升 1°C可以带来 4%的制冷成本节约。有鉴于此,一些高温节能产品也应运而生,例如:
高温节能服务器:“高温”是指服务器耐高温能够在 5°C至 47°C环境温度下,无需空调制冷,能稳定运行,由于服务器能适应更高的机房温度,而带来制冷能耗的减少,相对传统服务器而言,高温节能服务器具有耐 高温、低能耗、易部署等特点,对于机房节能也是一大功臣。
高温冰水空调:一般机房内大多是属于显热,只有很少数的潜热,因此 除湿的需求非常少,机房精密空调的入水温度便可以从一般的 7°C往上调升,在此情况下,冰水主机的制冷量增加,能效比改善,也就争取更多空调节能的机会。
六:导入数据中心管理系统(DCIM)
为了协助数据中心经营者更有效、全面地管理数据中心,数据中心基础设 施管理系统(Date Center Infrastructure Management, DCIM)就应运而生。 DCIM 可通过机房鸟瞰图,协助 IT 经理人实时应对、事先规划、管理可能的风险,并减少停机时间。如前所述,个别服务器利用率低是数据中心普遍存在的问题,DCIM 可协助数据中心人员找出长期闲置的服务器,加以重新配置,以提升效率,并准确测量数据中心资产及能源的使用状况。
四、结论
数据中心绿色节能需要发挥相当的创意,不应受到传统思维的局限。业界 有许多案例均显示机房节能可以带来许多实质的好处,而 PUE 值可以作为一个 能效指标的基础,对于创造永续的绿色数据中心而言是非常重要的。
就目前来说,百分百纯净的能源是遥不可及的梦想,然而还是有许多企业用的是“混搭” 策略来接近此理想目标。举例来说,包括利用再生能源、就地发电以及远距电网等等。IT 巨擘如苹果所安装的 55,000 片太阳能板、eBay 在犹他州 Quicksilver 工厂利用燃料电池,以及微软利用风力和太阳能。
中小企业在数据中心选址时,或许可以与当地公用事业合作,取得干净的电力或再生能源,也可在新数据中心选址时,考虑设置在纯净能源公用事业的周边地区。
同时, 一般企业可以透过例行测量 PUE,以及善用管理工具(如 DCIM)找出并修正 IT 低效率的部分,减少碳排放,提高个别服务器的使用率,最终达到 PUE 及 ROI 优化的目标。