咨询QQ:
      杂志订阅

      编辑

      网管

      培训班

      市场部

      发行部

电话服务:
 010-82024981
欢迎, 客人   会员中心   帮助   合订本   发布信息
设为首页 | 收藏本页
阿里云挂了,运维人活了
  • 云平台也一样,为了用户的计算、存储和网络的安全供给,云计算服务商需要不停地对云数据中心进行维护和检修,确保各种设备的安全运转。

    一首《运维骆驼》道出了无数运维人员的辛酸。
      
      运维同仁就像骆驼
      
      纵使背锅
      
      依然步伐坚定、昂首前行!!
      
      我要迈开运维年华
      
      再苦在累我也不会害怕
      
      这边宕机的忧
      
      那边背锅的愁
      
      无法阻挡我决心的奋斗
      
      理想很丰满,现实很残酷呀。运维人员的苦,你永远不懂。
      
      就在上周日,云中炸雷惊春梦,阿里云华北2区的部分ECS服务器出现了IOHANG故障,导致用户APP和网站业务受影响的消息,于是一大波运维人员裹着被子,从疲惫的梦乡中,立马满血复活,一大早就开始忙碌了。
      
      IOHANG是个什么鬼,可以理解为存储(硬盘、系统)IO吞吐出现问题,挂掉了。
      
      其实,如果你在企业负责IT就知道,这样的IT故障并不值得大惊小怪。但是云平台就像一个城市的自来水厂,供不上水,不止一家人的饮水受到影响,而是整个片区的市民饮水需求得不到满足。
      
      为了不影响市民的饮水安全,自来水厂需要经常对各种设备进行维护和检修,确保事故发生之前,将隐患及时的除掉。
      
      云平台也一样,为了用户的计算、存储和网络的安全供给,云计算服务商需要不停地对云数据中心进行维护和检修,确保各种设备的安全运转。
      
      1、需求千万条,运维第一条
      
      对于投入商业运行的云数据中心,为了确保其安全稳定地对外提供服务,需要各种供应商提供各类服务。
      
      但需求千万条,运维第一条,特别是对重要的IT资产的运维,是保证云平台正常对外提供服务的核心。
      
      数据中心基础设施管理(DCIM)是被广泛接受的数据中心运维的成熟模式。它是一种将IT和设备管理结合起来,通过软件、硬件和传感器,对数据中心关键设备进行集中监控、容量规划、资源优化的管理方式,能够帮助数据中心识别和处理影响IT系统可用性的关键设备故障,提高数据中心的工作效率和稳定性。
      
      如果说现代医疗体系实现对人的生命周期进行科学管理,那么,IT设备的生命周期管理,就需要像DCIM这样的管理系统为其提供服务。
      
      如今,随着物联网技术的快速发展,服务器定位技术取得了重大突破,DCIM核心的U位资产管理也实现了数字化运维的商业布局。它的推广和应用,不仅丰富了数据中心的运维工具包,还大幅度节省了用户的人力和时间成本,为U位资产管理市场的快速发展铺好了道路。
      
      2、一个梦引发的创新方案
      
      在云数据中心,数以万计的服务器好比云计算系统的“心脏”,为了保护和管理好这些“心脏”,运维专家们可谓是绞尽脑汁,也难以在“定位100%准确和维护简便”两个维度,找到满意的技术方案。
      
      在欧美和中国的高科技企业对U位定位技术进行不断探索和努力之后,一种比EIC和RFID技术更可靠、更精准的磁触发MC-RFID技术方案,在深圳这个创新之城被发明出来。
      
      据说,这个技术的灵感来源于一个地球自转的梦,最终通过捕捉宇宙力量的原理,实现了无源主动触发和精确定位的物联网技术。
      
      这种技术方案当前已应用于数据中心的U位资产管理领域。
      
      据运维专家和最终用户的反馈,市场上现在的U位资产管理产品的质量参差不齐,但在高端产品中,基本实现了自动化运维方面的功能,比如:
      
      1.资产数据的100%准确;
      
      2.U位资产的自动化盘点;
      
      3.资产的实时监控,资产异动及时告警;
      
      4.交付便捷,维护简易,对应用透明。
      
      行业权威媒体《UPS应用》杂志,曾经在报道中描述磁触发MC-RFID技术方案给数据中心运维带来的价值:
      
      可靠是数据中心运维的核心诉求,在保证可靠的基础上,MC-RFID资产管理产品实现了规划快、上架快、维护快的客户价值,反映了这种产品不仅大幅度提升工作效率,还在产品可用性、易用性方面提升了用户的使用体验。
      
      从专业的产品测评工程师那里,我们获得了更具体的产品信息——这种产品采用了专利磁吸附式设计,安装灯光指引功能,智能预占位告警功能,通过三重设计来保证产品的安装零偏差。
      
      另外,该产品采用了主从模块设计,不仅可以灵活组合适配不同高度的机柜,还兼顾了运输的便捷性。
      
      在供电方面,该产品采用POE供电,无需外接控制器和电源,实现即插即用,安装和布线都能快速完成。
      
      据了解,当前市场上出现了仿冒山寨这种MC-RFID技术方案的产品,品质与功能烂得一塌糊涂。
      
      3、运维技术大家一起上
      
      不断出现的黑天鹅事件,让云计算服务商对安全不敢马虎大意,从网络安全、物理安全、人员安全到运维安全,云计算产业形成了一套科学的管理机制。
      
      在运维领域,伴随技术方案的成熟,越来越多的企业开始在自己的云数据中心内部署U位资产管理系统,来实现对数据中心的精细化和智能化管理。
      
      腾讯云
      
      腾讯数据中心,将采用包括自动化资产管理在内的多种物联网技术,提升运维效率,并最终实现数据中心无人化管理。U位资产管理技术除了实现服务器的快速精准定位外,还将机柜空间碎片化充分利用起来,提升了机柜投资价值的最大化,并实现了IT设备的全生命周期的管理。
      
      去年年底,腾讯正式向业界推出了智维平台。它由服务腾讯内部的星云平台升级而来,是将腾讯在网络、存储、大数据处理、人工智能等领域的技术积累,应用在数据中心智能化运营领域,以在较低的成本下,实现精细化和高效率的运营效果。而资产和容量管理正是其核心功能之一。
      
      华为云
      
      自从2017年华为云BU正式成立以来,华为云就加大了在全球的快速布局。同时,华为也在数据中心智能化技术的道路上越走越远。
      
      比如在廊坊云数据中心,利用AI技术,华为将服务器、存储等设备中故障率最高的硬盘、内存数据进行处理,提前预测硬盘、内存的故障趋势和发生时间,实现了从预防性维护到预测性运维的跨越;通过iCooling技术,智能协同IT与制冷系统,调节制冷系统运行在最佳状态,年均节能超过5%,每年节省电费近千万。
      
      通过部署U位资产管理系统,华为数据中心实现了每个机柜的容量管理,有效利用了空间资源,实现了基础设施的资源可视化和利用效率最大化。
      
      编辑:Harris
      
      

    云平台也一样,为了用户的计算、存储和网络的安全供给,云计算服务商需要不停地对云数据中心进行维护和检修,确保各种设备的安全运转。