当今IT运营日益复杂是毋庸置疑的:软件正变得越来越复杂,它运行的基础设施也同样如此。从某种程度上讲,这种复杂性来自于管理的基础设施的逐层增加,从裸机服务器到虚拟机,再到容器,再到基于功能的计算,以及数据中心采用新技术中和旧技术循环的速度。
短暂的和多代的基础设施(通常是并行)是新的常态。新老技术交织在一起,虽然新技术可能令人关注,但随着下一个新事物的出现,它们很快就变得平凡。
这里有一个令人清醒的数据:2017年第四季度,IBM的主机业务增长了32%。因此,即使IBM的云计算、人工智能和安全计划在不断增加,大型机仍然维持着大部分业务。旧技术坚持不懈,人们必须找到新的解决办法来弥合新旧之间的差距。
当人们谈论大型基础设施时,技术混杂和它们带来的挑战更加复杂。
什么才是大型基础设施?
出于讨论的目的,大型基础设施组织已经存在了至少十年。这意味着他们取得了成功,他们已经发展和成长,而基础设施也随之发展,并且所使用的技术也在不断扩展。
组织的的历史、规模和收入并不特别重要;重要的是,如果有足够的时间来积累资源、人员、,实践和技术来创建混合问题的东西,那么原有基础设施可能开始出现问题。
大型基础设施的挑战
大型基础设施面临的挑战来自技术本身以及人们使用该技术的方式。随着组织的发展,其团队通常会变得越来越大,越来越孤立,并且部门目标变得脱节。即使在实现同一目标时,部门在实现该目标的方法上也存在分歧。
现在,将工具和技术添加到组合中:随着时间的推移,团队会选择自己喜欢的工具,或者构建自己的工具,这在一段时间内行之有效,直到他们不得不与使用不同工具和一套完全不同的实践的另一部门进行协作为止。
现在,添加不同的工作风格、性格类型和公司政治,一切都会很快被弄乱。要跟踪谁在使用什么,他们如何使用它以及什么在起作用(或不起作用),并不是一件容易的事。
例如,一个客户有一个团队使用Chef,并且全力以赴,并且也试图从其他团队那里买入,但是还有另一个团队是Docker早期的使用者,人工操作Docker主机,并且不想使用Docker,然后有一个不同的团队,他们是Kubernetes的早期用户,不想使用Docker,而另一个团队则使用Puppet。一旦他们彼此合作,事情可能崩溃,有人必须胜出。组织几乎必须维护一个逻辑图,该图说明哪些团队使用哪些工具作为与这些业务部门开会的准备。不仅在应用程序的部署方式上没有一致性,而且在监视这些不同技术的方式上也没有一致性。
例如,过去,Netflix公司表示监控占基础设施成本的30%,最近又提到他们计划在2019年在基础设施上花费19亿美元。考虑所涉及的规模和复杂性,他们正在存储和分析支持约1.25亿订户的系统的日志、行为和指标。
跨大型基础设施连接异构数据
那么,如何简化和连接分散在各个零散的工具和系统中的所有数据?
一种解决方案是数据湖,这是一个集中式存储库,可让企业将数据集中到一个地方,以便对基础结构有一个整体的了解。实际上,大型基础设施最终会产生多个相互隔离的数据湖。
企业还可能遇到不匹配的情况,例如将一种格式的数据需要转换为另一种格式才能进入一个数据湖。
这是监视工具必不可少的地方。寻找一种监控工具,该工具旨在收集不同数据类型的数据并将其转换为任意数量的格式,因此企业可以设置自动化工作流,以从传统系统(例如大型机)以及容器等现代基础设施中获取数据。
这个想法的一个例子是Sensu,以及人们对Nagios插件规范和Prometheus导出器指标(在许多其他指标格式中)的支持。通过使用适用于各种指标格式的监视工具,企业可以将他们已经在使用的服务检查以及来自多云基础设施的数据插入其监视设置,并获取有关其系统的有价值的信息。
像Grafana这样的可视化工具为锦上添花。使用Grafana,企业可以将数据存储在任何地方(例如Graphite、InfluxDB、Prometheus等),将数据可视化并显示在可共享的图形和仪表板上。使用监视工具作为Grafana的数据源意味着企业可以显示监视事件和清单,甚至可以将这些数据与同一Grafana仪表板上的不同数据源混合。将整体监控解决方案与Grafana的可视化功能相结合,可提供所需基础架构的数据驱动视图,即使它仍然是多代、多隔离、多数据存储,2,000种不同格式类型的混合路径大基础设施。
编辑:Harris