人工智能提高数据中心的可用性和效率

91y官网充值中心

2018-10-30

在数据中心设施内部,有越来越多的传感器收集来自包括电源备份(UPS)、配电装置、开关设备和冷水机组在内的设备的数据。

关于这些设备及其环境的数据由机器学习算法进行解读,这些算法深度分析性能和容量,并确定适当的响应,例如更改设置或者发送警报等。

随着条件的变化,机器学习系统从变化中学习它实际上是被训练为自我调整,而不是依赖于具体的编程指令来执行其任务。

其目的是使数据中心运营商能够提高设施的可靠性和效率,并有可能更自主地运行这些设施。 然而,获取数据并不是一项简单的任务。 施耐德电气公司数据中心全球解决方案高级主管SteveCarlini说,基本需求是获取来自主要组件的实时数据。 也就是那些冷水机组、冷却塔、通风机、风扇等组件的实时数据。

在IT设备方面,它意味着服务器利用率、温度和功耗等指标。 Carlini说:很难对数据中心进行评价。 数据中心与配电和散热有关的连接点是非常多的,如果企业想尝试人工智能,就需要获得这些连接点的数据。

IT专业人员习惯于设备监测和实时报警,但在机房设施方面并非如此。 Carlini说:IT设备对信息的要求是即时的,而在电力系统中,不是即时的,其环境不同。 过去不到十年的时间里,第一个数据中心已经完全仪表化了,用仪表来监测供电和散热。 在仪表存在的地方,很难进行标准化:数据中心运营商依赖于采用多种通信协议的楼宇管理系统从Modbus和BACnet到LONworks和Niagara,并且必须兼容不共享数据或者不能通过远程控制进行操作的设备。 Carlini说:TCP/IP、以太网连接这类连接在传动系统和散热领域是前所未闻的。

好消息是数据中心监测正朝着高级分析和机器学习所需的深度发展。 Carlini说:服务提供商和托管提供商一直非常擅长在子架级或者机架级进行监测,以及对能源使用情况的监测。

企业开始部署它,这取决于数据中心的规模。 机器学习让数据中心保持凉爽2016年,德尔塔航空公司由于电力系统故障导致数据中心停电,三天时间内停飞了大约2000次航班,使该航空公司损失了亿美元。 这正是基于机器学习的自动管理功能可以避免的应用场景。 由于数据中心性能的进步以及云中数据池的出现,智能系统有可能发现数据中心运营中的漏洞,从而提高效率,而这是手动过程做不到的。

机器学习推动的智能应用的一个简单例子是基于状态的维护,它应用于数据中心中的消耗品,例如,冷却过滤器等。 Carlini说,通过监测流过多个过滤器的空气流量,智能系统可以检测到一些过滤器是否比其他过滤器更容易堵塞,然后把空气引导到不容易堵塞的单元中,直到需要更换所有过滤器为止。