今天分享的是
智能汽车专题系列
深度研究报告:《
智能汽车专题:为汽车行业正确构建 AIOps
》
(报告出品方:
dynatrace
)
报告共计:
18
页
引言
AI 的前景
AI正在推动企业软件进一步创新,使智能自动化和垂直整合达到新的水平。但随着目前企业系统规模的扩大,数字化和云计算的优势与技术复杂性和运营风险并存。AI技术支持的软件智能有望应对这些挑战并实现新一代自主云企业系统。
精通数字化技术的客户主要关注客户体验,他们正日益给汽车行业的企业带来压力。事实上,消费者对卓越体验的需求正在推动汽车行业的创新,其中表现优异的企业正在挖掘前所未有的竞争优势。
不拘于错误检测,实现自我修复
想想以下这个屡见不鲜的挑战:当全球服务受到影响时,基于微服务的大型应用程序中的异常会触发大量警报。由于应用程序实际上包含数以百万计的依赖项,如何才能找到最初的错误?传统的监控工具并无太大的帮助。这些工具只会收集指标并发出警报,但几乎无法回答问题出在何处。
相比之下,人们希望有一种智能系统能够准确提供答案,也就是说,找出异常情况的技术问题根源以及解决方法。如果此类智能系统准确可靠,则可以在大多数用户发现故障之前触发自动修复程序。
AI 和自动化有望从根本上改变运营方式。更重要的是,从软件开发到服务交付,再到客户互动,整个数字价值链都需要收集和应用智能。智能集成和自动化将推动企业软件进一步实现创新。
异常检测和警报
洞察力
自动化操作的概念着眼于更妥当地排除故障,最终目标是缩短平均恢复时间 (MTTR)。这通过自动异常检测和警报(即快速平均发现时间 (MTTD)来实现。然而,进一步缩短 MTTR 需要自动的问题根源分析。
挑战
传统的监控工具侧重于通过应用程序性能指标和基线方法来区分正常行为和错误行为。定义异常值是一项棘手的任务,需要机器学习等先进的统计方法。然而,事实证明,在云应用领域,即使采用最好的基线方法也远远不够。
使用现代微服务架构,单个故障会影响多个互连服务,这些服务随后也会出现故障。因此,一个问题可能会触发许多警报。这就是所谓的警报风暴或杂乱警报。
传统的监控解决方案无法解决这个问题。操作人员仍需弄清楚警报的原因。问题分类成为一项耗时且通常令人烦恼的工作,需要召开集体会议和花费大量时间。
唯一的解决方法是找到一种自动确定问题根源的可靠方法。