徐新:绿色数据中心建设与自动化运维实践

发布时间:2023-09-19
浏览次数:

  2018年,国家卫生健康委出台了《全国医院信息化建设标准与规范(试行)》,规定二级医院的主机房要大于等于60平米,三级医院主机房大于等于100平米,这对医院中心机房建设提出了很高的要求。为保障资源环境的可持续,绿色低碳已成为数据中心建设的新标准,对医院数据中心也提出了同样的要求。

  “我们可以从三个维度理解绿色数据中心:一是数据机房中的IT系统、机械、照明和电气等能取得最大化的能源效率和最小化的环境影响;二是可以从建筑节能、运营管理、能源效率等方面来衡量一个数据中心是否为‘绿色’;三是绿色体现在整体的设计规划以及机房空调、UPS、服务器等IT设备、管理软件应用上,要具备节能环保、高可靠可用性和合理性。”北京儿童医院院长助理、信息中心主任徐新对绿色数据中心的内涵进行了阐述。

1.jpg

推进绿色数据中心建设

  徐新介绍了传统机房和绿色数据中心的区别:在能源消耗方面,传统机房能耗较高,绿色数据中心绿色节能;在硬件资源方面,传统机房存在服务器堆砌、资源浪费的情况,绿色数据中心的虚拟化部署充分发挥性能;在管理水平方面,传统数据中心管理复杂,绿色数据中心是自动化管理,效率高;在运维成本方面,传统数据中心运维效率低,故障率高,绿色数据中心是低运维成本;在部署方式方面,传统数据中心采取的是传统的部署方式,绿色数据中心是模块化、按需部署。

  “医院信息中心在关注业务系统建设的同时,也要花相当精力关注数据中心的建设。在此过程中,我们需关注数据中心能效指标(PUE),它的计算公式是数据中心年总耗电量除以信息设备年耗电量,体现的是数据中心运行过程中IT设备能源消耗占比。”徐新指出,能耗比越低说明数据中心的运营效率越高。国家标准《数据中心能效限定值及能效等级》(GB 40879—2021)给出了一个定级标准:一级能耗为1.2、二级能耗为1.3、三级能耗在1.5。统计数据显示,目前国内大部分医院数据中心PUE>2.0,有少量PUE在1.70附近的大型数据机房。

  徐新认为,医院数据中心年总耗电量主要包括以下几部分:一是IT设备。这部分在整个PUE评价体系里面是有益的能耗,主要包括服务器、存储、网络类、IT支撑类;二是制冷设备,主要包括机房内所使用的空调设备、提供冷源的设备、新风系统;三是供配电的系统,主要包括变压器、配电柜、发电机、UPS、HVDC、电池、机柜配电单元等;四是其他设施,包括照明、安防、灭火、防水、传感器以及数据中心建筑的管理系统等。“我们在规划数据中心建设时,要提高PUE的效能,需压缩制冷设备、配电系统和其他设施的能源消耗占比,从而保证IT设备能源消耗的比例。”徐新强调。

  在具体实践中,医院可根据GB50174-2017《数据中心设计规范》对机房环境做出设定:冷通道或机柜进风区域温度为18-27摄氏度,冷通道或机柜进风区域湿度和露点温度为5.5-15摄氏度,同时相对湿度不大于60%。在机房冷却循环期间,由于从空气中去除潜热,在冷凝单元内形成冷凝,因此在空调负荷的计算时,因为空气里含有水蒸汽,所以就要计算其显热负荷和潜热负荷。对于数据中心的精密制冷系统,显冷比越大越好。机房的热量主要是显热,所以机房空调的显冷比较高,一般在0.9以上(普通舒适型空调只有0.6左右)。数据中心使用大量的非线性设备,如IT设备、UPS、变频空调等,因此在供配电系统节能方面采取抑制谐波的方法:医院非线性负载成组配置,主要是指UPS、开关、变频空调等电流控制等设备,采用不同母线供电,安装电抗器,同时柴发尽量靠近负载所在建筑物,减少线路损耗。

  在机房供配电系统方面,高频UPS节能性高于工频UPS,同时使用模块化UPS有利于灵活改善UPS负载率。空调需根据医院自己客观的物理环境选择合适的制冷方式。“无论是风冷、水冷,还是双冷源空调,最重要的还是根据医院自己情况选择。”徐新介绍,机房的气流管理和数据中心的温湿度有直接关系,改善机房气流组织可通过以下方式:采用CFD气流模拟软件进行气流分析、合理布置冷热通道及机房空调、采用封闭冷热通道进行气流隔离。

  徐新建议,设备气流流向模式一般为从前到后、从前到上,或者从前到后和顶部。如果认为有必要,也可采取其他气流方向,比如从下到上。

  在冷热通道方面,目前大多数医院新建数据中心采用冷通道居多,热通道相对较少。“采取冷通道或热通道各有利弊,建议结合自身情况选择。”徐新强调,在做出决定之前,需要仔细查看计算机房的要求和设置,最终,两种解决方案都具有相同的目标和原则,即完全分离热空气和冷空气,避免混合以提高效率。

加强自动化运维

  在信息中心的日常工作中,自动化运维是非常重要的一项工作内容,主要包括设备调试、执行和监控,其中有三个核心关键词:自动化、配置管理和监控。“自动化、配置管理、监控是运维管理建设的三驾马车,三者之间既相互独立也相互联系。三者的建设路径并没有严格的先后顺序,可以共同建设、共同迭代。”徐新介绍,信息中心在帮助临床和管理建设信息系统的同时,也要关注自己的信息化建设情况。

  徐新推荐了一款开源运维自动化工具:Ansible。它是基于Python开发,运维工程师对其二次开发相对比较容易;拥有丰富的内置模块,几乎可以满足一切要求;管理模式非常简单,一条命令可以影响上千台主机;无客户端模式,底层通过SSH(安全的网络传输协议)通信。通过Ansible可以实现运维自动化,提高运维工程师的工作效率,减少人为失误。它通过本身集成的非常丰富的模块,可以实现各种管理任务,其自带模块超过上千个,操作非常简单,提供的功能又非常丰富。

  徐新认为,随着云计算和AI的发展,自动化运维也在持续发展:自动化运维从传统的面向计算、网络、存储等基础设施资源在往面向应用架构发展;私有云、公有云和专有云的普及,自动化运维不能仅仅局限于传统的以操作系统为中心,需要更好的支持各种云服务;云原生、微服务、容器普及,自动化运维需要更好的支持新型的资源和应用架构;自动化运维不再是IT运维人员的工具,更需要变成面向全体技术人员的普遍服务;需要越来越强大的分析能力。这里的机器替代人工,不仅仅是替代运维人员的操作过程,更核心的是替代操作前的人工思考、分析、决策过程,而完成操作本身的自动化是执行过程。

  “医院在开展新的数据中心建设时,主要注意以下几点:第一,要适度规划、合理布局,这是基础;第二,提高精密空调制冷效率,这是重点;第三,采用低能耗精密空调;第四,采用低能耗UPS主机;第五,配套智能照明+LED光源节能灯具。”徐新总结道。

  (本文根据徐新院长助理在CHIMA 2023大会演讲内容整理)