改善数据中心运营的6个最佳实践

因为每个数据中心和IT运营都是独特的,影响整体运行的变量很多。Brynolfsson认为,两个不同的公司拥有几乎相同的IT生态系统,但其中一个公司的生产率可能只有其竞争对手的一小部分。但是,首席技术官可以遵循几个最佳实践,以确保其IT操作高效、在能力范围内运行并尽可能高效地执行。



来源 | 机房360

编辑 | Harris  

  


      行业专家Erik Brynjolfsson在发表的一篇文章中指出,“当今IT经理面临的关键问题不是‘IT是否有回报?’,而是‘我们如何才能最好地使用计算机?’”这不是一个简单的问题,因为每个数据中心和IT运营都是独特的,影响整体运行的变量很多。Brynolfsson认为,两个不同的公司拥有几乎相同的IT生态系统,但其中一个公司的生产率可能只有其竞争对手的一小部分。但是,首席技术官可以遵循几个最佳实践,以确保其IT操作高效、在能力范围内运行并尽可能高效地执行。


1.清理和销毁

  

  清洁可以缓解压力。服务器和网络设备都有固定的使用寿命,旧设备应该按照制造商规定的时间表退役。旧设备应妥善销毁、回收或退回制造商,并将所有数据擦拭干净,以确保适当的安全。


2.测量PUE

  

  谷歌是全球最大的云服务提供商之一,他们运营着大量的数据中心,其中一些包含数千台服务器。该公司对保持数据中心在高峰时期的运行有一两点了解。谷歌公司表示,人们如果无法管理不能衡量的东西,搜索引擎的领导者通过衡量能源使用来描述其数据中心的效率表现。

  

  谷歌公司说:“我们使用能源使用效率(PUE)来帮助我们减少用于非计算的能源,比如冷却和配电。”该公司的数据中心至少每秒测量一次样本。另外,还考虑了天气因素,因为季节变化对PUE有显著影响。


3.管理气流

  

  “良好的气流管理是数据中心高效运行的基础。”谷歌公司指出。热点应完全消除,而空白页或填充面板应用于空机架插槽。这有助于减少灰尘问题。填充板确保气流不受干扰,灰尘可以很容易地吹走。适当的气流对冷却至关重要。

  

  使用正确安装的填充面板,空气会吹到它应该吹的地方,从而在服务器运行时保持机架处于适当的温度。这是一个最小的成本投资最大的性能增强解决方案,非常值得花时间安装填充面板。


4.监控一切

  

  根据Plant&Works工程公司的说法,man是“有史以来最好的状态监测设备”,但他的地位正受到当今众多监测工具的威胁。一个经验丰富的IT技术人员可能会理解他多年来使用的系统的每一个细微差别,但是今天的流程和监控工具在理解操作流程方面比人要深入得多。业务流程管理(BPM)软件、机器人流程自动化(RPA)和AIOps都是从早期的IT操作管理工具演变而来的,旨在通过自动化流程以及潜在的自我修复系统来增强IT操作。

  

  Gartner将AIOps定义为一个平台,利用大数据和人工智能增强IT运营功能,如监控、自动化和服务台活动,并具有前瞻性、个性化和动态洞察力。”AIOps平台支持同时使用多种数据源、数据收集方法、分析(实时和深层)技术和表示技术。AIOps解决方案可以了解和监控公司的日常IT操作,分析整个IT系统,然后解决问题或向有能力的人发出警报。


5.容量规划

  

  容量规划是确定组织的系统和运营需求的过程,目的是了解和满足由于销售和使用公司产品和/或服务而不断变化的IT和能源需求。容量管理试图在高峰使用时以适当的性能平衡适当数量的用户,以确保令人愉快的最终用户体验。IT容量规划包括估计公司的存储、硬件、软件和连接基础设施所需的资源,以便系统尽可能以最佳方式工作,同时限制浪费的容量。容量管理旨在向物理或虚拟服务器添加或减少CPU、内存和存储。

  

  首席技术官应该优化他们的系统,同时通过将业务需求与云服务利用率关联起来,在应用程序级别不断地检查他们的云使用情况。首席技术官应通过高级分析计划增长并预测即将到来的成本。通过监视一切,首席技术官将非常了解IT部门的CPU、内存、存储和电源使用情况,并采取相应的行动。


6.提高价值


  数据中心是当今大多数企业的业务处理中心。增加容量、减少冗余和提高总体效率应该是每个首席技术官的目标。在许多方面,首席技术官被要求做不可能的事情。大数据只会变得越来越大,越来越难以处理。大数据的五个V已经扩展到七个—体积、速度、多样性、可变性、准确性、可视化和价值。

  

  以前从来没有这么多公司有这么多的方法来收集、跟踪、量化,甚至可视化数据,但这几乎是一个压倒性的任务。5G的推出和物联网的扩展只会让数据收集、集成、虚拟化,甚至可视化变得更加困难。

  

  Brynjolfsson警告说,“在信息经济中,稀缺的资源不是信息,而是人类处理这些信息的能力。以下的许多最佳实践将人类从等式中剔除,这并不是一件坏事,因为人们的时间通常可以更好地花在更高层次和创造性的努力上,而不是重复的、令人麻木的工作上。在价值链高度自动化的部分,信息流的速度往往会急剧加快,因此却在其他地方遇到了僵局,特别是在人们必须参与、流程没有更新的地方。结果是整体表现几乎没有变化。”

  

  现在是整理数据中心的时候了,也许这需要更多的自动化和更少的人力。