数据中心的监控:我们如何将旧的BMS更改为新的BMS。第三部分

我们继续讲述如何更改数据中心的BMS系统(第1 部分第2部分)。同时,我们不仅将一个供应商的解决方案更改为另一个供应商,而且还从头开始开发了满足我们要求的系统。总结我们的故事,我们分享完成的工作结果和可能对您有用的有趣解决方案。

新介面


正如他们所说,在这里最好只看一次。

机架。

让我们分析差异。

  • 首先,它是美丽的舒适。请注意,跟踪PDU的模块(“组”或仅“组”)上的负载以及已配对模块的并行负载总和变得多么容易。在新BMS的机架模型上,我们立即看到较低的配对PDU过载(允许的16A以上的总电流是“蓝色”通知),而较高的PDU则负荷不足。如果其中一个输入断开,则整个负载将转移至第二个负载,并且由于过载,下部通电的下部模块也将断开。为避免这种情况,数据中心支持服务将提前警告客户,并发送有关如何重新分配负载的建议。
  • . BMS PDU. BMS , , - « ».
  • . . . , ( ) . , . 
  • 直观的界面。在新界面中,没有大量的图标,风扇旋转,切换“点击”。最方便的是能够指示机架内PDU线A / B的状态。我们试图在旧的BMS中做类似的事情,但是每平方厘米卡片中合并图标的数量迫使我们放弃了它。

现在,眼睛很高兴观看:


服务器


主配电盘的片段。


通风控制面板。

您可以为新年装饰新的BMS :-)


一页-了解和没有传统知识


很长时间以来,我们想在BMS中实施另一个“技巧”:在一页上构成数据中心的主要参数,这样一眼便可以看到屏幕上的内容,以评估主要系统的状态。但是,我们并不完全了解它的外观。

甚至在开始开发新的BMS之前,我们就游览了荷兰的数十个数据中心。目标之一是查看实现此页面的示例。

而且没有在任何数据中心中向我们展示它们-在某个地方,没有,“现在正在开发中”,在某个地方,这是一个“大商业秘密”。因此,在我们用于创建新BMS的ToR中,缺少对该页面非常重要的准确描述。

结果,我们从字面上“随时随地”提出了它。就在那一刻,我不得不远程咨询数据中心的同事。在电话上滚动浏览BMS页面以查找不同的数据非常不方便,实际上,第一版的“一页”是在餐巾纸上书写的。它是由照片的开发人员实施的。 

以谨慎的荷兰同事为例,我们将不演示主页的最终版本,尤其是由于每个数据中心都是唯一的,因此没有意义进行复制。但是,我们描述了其形成的两个主要原则:

  1. , ( , ), . «» , . 
  2. ( ). , .  - – . .

实际上,现在,由负责的工程师和经理将数据中心的所有关键特征完全分组并显示在智能手机/显示器的同一屏幕上,同时实现了与数据中心的物理和逻辑拓扑的连接。 

这是初稿的照片,当然,然后重新考虑并定稿了该版本。



事故确认和总结


让我们为我们讨论另一个新概念,这个新概念是由于更新监视系统的项目而出现的。

致谢是新BMS的开发人员建议使用的一个相当罕见的术语。这意味着确认操作员已看到该事件,确认该事件并承担消除该事件的责任。  

这个词已经扎根,现在我们“承认”这些事件。

新BMS基本版本中规定的算法不适合我们。实际上,这些是对事件日志的注释,也就是说,已解决的事件没有从日志中消失,并且接收到的(“已确认”)消息也没有从新消息中进行排序。

结果,开发了一个名为“摘要”的窗口,其中:

  1. 在服务模式下仅显示活动事件和设备(不显示商业“蓝色”通知)。
  2. 新事件和接受事件明显分开。
  3. 显示谁接受了事件。

新的BMS中的任务算法如下:

  1. 报告新事件并等待确认。他们不能在此区域停留很长时间,值班的设备官员应立即将事件发生在自己身上。
  2. 员工通过单击右侧的对勾接受事件。由于所有员工都具有唯一帐户,因此它将自动显示接受事件的人员。如有必要,请发表评论。
  3. 事件移至“已确认”部分,其余的话务员和经理知道事件涉及负责人员。



摘要窗口的示例,其中包含新的且已确认的消息。

将摘要窗口与“一页”表连接起来后,我们得到了BMS系统的完整主屏幕,您可以在其上立即看到: 

  • 主要数据中心系统的状态;
  • 存在新的未处理事件;
  • 是否存在可接受的事件以及有关谁专门消除这些事件的数据。

通过浏览器访问和手机上的弹出警报


可以从世界任何地方的任何设备访问的Web界面与“胖”客户端形成了鲜明的对比,该客户端完全对外部用户不开放。 

旧的方法带来了一系列不便,从组织监视服务员工的远程工作中遇到的问题,到需要从数据中心员工工作的分布中安装“专业”客户的需求。

现在,BMS中的任何页面都有一个唯一的地址,它使您不仅可以共享页面或设备的直接地址,还可以共享指向唯一的图形/报告的链接。 

现在,通过Active Directory通过LDAP身份验证提供对系统的访问,从而增强了系统的安全级别。 

今天的机动性是值班工程师质量工作的关键因素。除了监视值班室中的监视之外,工程师还绕道而行,在“值班室”之外执行例行工作,并且由于针对移动屏幕进行了优化的BMS主屏幕,一秒钟都不会失去对房间中发生的事情的控制。 

通过工作聊天的功能来提高控制质量。它们加快了工作流程,使您可以将值班工程师的信函“链接”到BMS。例如,我们使用“团队”应用程序,该应用程序允许您进行内部通信并以弹出式“推送”通知的形式从手机上的BMS接收所有消息,从而使值班人员不必经常查看手机屏幕。


 在智能手机屏幕上推送通知。


因此,通知会显示在“团队”应用程序中。

同时,仅针对事件消息配置弹出式通知,从而最大程度地减少了干扰,工作人员知道,如果在智能手机的屏幕上显示Teams Push通知,则需要转到BMS页面并接受事件。BMS页面上已经跟踪了纠正措施消息。


在照片中,智能手机中的BMS界面。

总结


与从我们的旧供应商处更新BMS的成本相比,从头开始开发新系统(约10万美元),这些产品的功能差异被证明是巨大的。我们收到了针对我们的业务任务和流程进行了优化的灵活系统。我们还大大节省了维护和更新系统的运行成本。 

但是,当然有困难。 

  • -, , BMS, . , , , , . , . , , . 
  • -, , . BMS, . . , , .
  • -, . ( ) , , , .

今天,我们BMS系统的重大更新可以称为过去一年中最重要的项目,它将严重影响我们未来站点的运营管理质量。 

当然,我们并没有淘汰旧的铁服务器,而是“让它变得更容易”:我们清理了数千个“商业”虚拟传感器和PDU,并且只剩下了几十个最关键的设备,例如柴油发电机组,UPS,空调,泵,泄漏传感器以及温度。在这种模式下,它恢复了以前的速度,可以成为“储备储备”。顺便说一句,从旧的BMS中删除PDU后,现在已经释放了大约1000个不必要的许可证,您碰巧知道如何处理吗?

All Articles