
上述情况下 Google 进行电力基础设施升级要重新调整 40% 的服务器流量,但是通过 PUE 仿真与专家知识的结合,团队选定了一套新的运营参数,从而将 PUE 再降了 0.02。不要小看这个值,考虑到 Google 有成千上万台服务器,乘上巨大的能耗就是可观的节能效果。
Gao 在今天发布的白皮书上解释了自己的做法。他说神经网络对复杂系统建模具有优势,因为神经网络不需要用户预设模型的交互特征,而是在特征中寻找模式和交互,然后自动生成最佳匹配模型。
该神经网络研究的因素包括了服务器总负载,水泵、冷却塔、冷水机组、干式冷却器、运行中的冷水注水泵数量;冷却塔水温、湿球温度、户外湿度、风速、风向等。Google 利用传感器部署了亿万个数据点来收集这些基础设施和电能使用信息。不过令人略为惊讶的是,Google 只用一台服务器就能跑这个神经网络了。

Gao 在白皮书中写道,Google 数据中心的实际测试表明,机器学习是利用传感器数据对数据中心能效建模的一种有效方法,可带来显著的成本节省。不过国内较为粗放式管理的数据中心恐怕短时间内难以效仿。
你觉得呢?