世界上最快的计算机“天河二号”有个“冷知识”:它每天都很热。热从何来?“天河二号”的功耗达17.8兆瓦,在一定的负载情况下,广州超算中心一年为“天河二号”付出的电费就高达八千万元。
“太热”也拖累了“天河二号”的效率。在性能能耗比的比拼上,“天河二号”几乎没有任何竞争力。
这正是高性能计算系统发展至今需要解决的两大问题:性能和能耗。2014年中国数据中心的总能耗超过900亿千瓦时,超过了一座中型城市的耗电量。随着各数据中心对PUE(负载耗能占比)等性能指标的关心,人们迫切需要建立“更深绿数据中心”。
中国诞生首款
量产液冷服务器
在实现“数据节能”的道路上,国内高性能计算厂商曙光公司走在了前列。在6月下旬举办的曙光2015创新技术大会上,该公司发布了中国首款可量产的液冷服务器:曙光TC4600E-LP冷板液冷服务器。与该服务器相配套的制冷解决方案能大幅降低整机功耗并降低机房噪音,机房全年PUE轻松降至1.20以下。
在此之前,服务器散热多靠空气来冷却,即气冷。不过空气并不是很好的冷源,一般的液体的冷却效果都会比空气强1000~3000倍。气冷所不能解决的高能耗、低性能的问题,用液冷技术可以得到显著地改善。服务器也因此实现了高密度、低噪音、低传热温差、自然冷却的效果。
值得一提的是,这款液冷服务器所需要的“冷却水”是很容易获得的30℃的水,不需用压缩机等装置,这使整个系统全年PUE下降到1.2以下变得非常容易。在液冷环境中,服务器的CPU可超频运行,计算性能因此可提高12%。
有国外研究显示CPU核温每提高10℃,可靠性降低一半,液冷服务器的CPU核温比风冷极限温度可低20℃~30℃,CPU可靠性也得到了大幅度提高。
“TC4600E-LP实际上是TC4600E服务器的液冷版本,以后曙光服务器都会同时开发液冷和风冷两种版本。”曙光数据中心产品事业部总经理沈卫东介绍说,该液冷技术的实现是通过将服务器最热的部分——高密度CPU的散热用液冷解决,与‘浸没式’液冷有所区别。
未来液冷或颠覆行业创新
冷板式液冷服务器是业内液冷模式的一种,暂时尚未触及服务器物理外形的变革。而另外一种液冷模式——浸没式,则有可能在服务器架构上带来颠覆式改变。
“目前冷板式液冷技术不太会改变服务器现有的物理形态,只是用冷板代替了原来的CPU的散热片,这一步比较容易实现。”沈卫东介绍说,浸没式则是“浸泡版”的冷板式,“冷板式实际上是一种中间替代方案,浸没式才是最终的结果。”
沈卫东称,未来的浸没式服务器或许是一个“缸”:大量贴在一起的主板,紧凑地浸泡在这个“缸”里面。预计该结构服务器的功率密度可以20倍于今天的产品。
“届时(浸没式液冷服务器)不但会抛弃现有服务器的外形,甚至会影响整个行业——除了冷却行业,他可能会影响到上游(如芯片设计等)很多行业。”沈卫东说。
部署液冷服务器不会加大数据中心成本
液冷,顾名思义,液体注入服务器,通过冷热交换带走服务器的散热。目前曙光公司对液冷技术使用会使相应服务器的成本提高约30%~40%。不过,这并不会增加数据中心的建设成本。
“发热部件CPU和部分电源模块的热量占服务器的70%,采用液冷技术后可以减少2/3的风冷(设备)投入。”沈卫东指出,液冷系统不需要压缩机,替代空调机“肯定是便宜了”,可降低数据中心基础设施投入。
如果不是新建机房而引入液冷服务器,综合考核液冷冷却器投入和风冷空调系统投入,液冷服务器所需的基础投入对风冷系统仍有优势,而服务器部分的“超支”一般可在1年到1年半在节能方面的表现回收成本。
此外,针对一些用户对液冷服务器液体泄漏的顾虑,曙光的技术团队调研了多种快速插拔方案,并在过去3年里做了大量的实验证实了其液冷服务器在该方面的可靠性。据悉,量产的TC4600E-LP液冷服务器已应用于建于曙光大厦的“地球系统模拟装置”原型系统上,该系统预计在7月底即可与公众见面。