专栏名称: talkwithtrend
中国企业IT人交流的技术社区
目录
相关文章推荐
新浪科技  ·  【#DeepSeek怎么看待概念股大涨#】“ ... ·  19 小时前  
国家移民管理局  ·  总台央视新闻联播:哈尔滨亚冬会各代表团抵达 ... ·  4 天前  
新浪科技  ·  #2025春节档票房破60亿#新浪科技讯 ... ·  4 天前  
创业邦  ·  回老家的人,后悔县城有房了 ·  4 天前  
51好读  ›  专栏  ›  talkwithtrend

可观测建设的目标究竟是什么?

talkwithtrend  · 公众号  ·  · 2024-09-30 07:35

正文

社区探讨,供大家参考:



金融同业的大家可观测的建设目标是什么?可观测建设需要做可视化的整合吗?

1、现状:我们并没有一个统一观测平台,各种系统软件自带基础架构监控和预警、Zabbix等,Prometheus、APM等有在用。就是各自都是一个信息孤岛。日常也遇到过信息孤岛导致查半天原来另外一个系统早已发出过告警。

2、我们有评估过商业化的国内外知名厂商APM软件,要么感觉完全整合在一起的导致整个系统监控过重。

3、思考与疑问:大家可观测的建设目标是什么?可观测建设需要做可视化的整合吗?本人对可观测的理解还只是停留在只要能够快速定位解决运维中出现的问题就算一个优秀的监控预警系统。是否有必要做整合,目前我们有用国内前三的云厂商,好像也是每个服务各自可视化查询的。本人对可观测建设并没有完整的认识,望各位专家和同行不吝赐教。

问题来自社区会员@ysryoyo 某保险公司系统工程师,以下分享均来自社区会员



@hym38 某银行 软件架构设计师:

我们内部的监控系统也有很多个,有网络监控平台、应用监控平台、链路日志监控平台等,从我们的实践结果看,不一定追求要建成一个统一的平台,但是数据一定要打通,其中,统一流水号、CMDB就是最关键、最基础的数据。比如:

1、交易链路日志要和网络链路日志打通,可以帮助定义网络层的故障。

2、链路日志要和监控系统打通,打通相关性能指标数据,帮助快速观测系统运行情况。

3、交易链路与日志打通,从链路可快速定位到相关的日志。

等等……

@Steven 某金融企业 IT顾问:

目标取决于想要什么,我个人观点,可观测目标一定是一个基于角色权限的一体化系统态势平台,每个角色和人员都可以一眼看到自己所管理和维护的系统或应用的运行状况,异常情况下可以快速定位和修复。

可视化是基础,不可见就难以理解,就不具备可观测性。

@Se7en_5 某城商行 系统工程师:

观测数据孤岛问题是个普遍性问题。我们的建设经历,可供您参考:

1、基于现状和需求的整个体系规划,我们是进行了“工具层”、“支撑层”、“场景层”三层整体规划,基于“一库两中台”去实现各类数据整合(运维数据中台)以及各运维场景的交付。

2、进行数据清洗整合,构建运维数据中台。在另一个问题中我也提到,如下:

(1)制定正确的数据标准,可以参考厂商或同业较好的数据标准实践,然后加入本单位关注的数据元素,形成各观测类据标准,注意数据的目的是为了应用,要把可观测场景充分考虑进去。

(2)高效的数据处理工具:一般借助大数据的flink或spark构建数据清洗、治理的ETL工具,当然前提是根据数据标准进行数据治理,将非标数据标准化。

(3)具备完善的数据服务接口:对于治理后的数据,一般通过kafka或API对外提供。

3、基于需求构建一站式可观测能力。一般是以链路为核心,其他观测数据为辅进行可视化呈现。

@guoxilin 某科技公司 高级非功能测试专家:

可观测的建设目标:当状态异常时,可以实现先止损后排查,通过统一监控大盘(业务、应用、资源),实现告警管理、应用日志分析和调用链路分析,辅助故障快速定位分析,应用与资源时间监控,资源超出阈值及时告警,辅助归因定位。

  您怎么看?

欢迎来探讨

欢迎点击文末阅读原文到社区阅读和讨论交流,发表您的看法

觉得本文有用,请转发或点击在看,让更多同行看到


 资料/文章推荐:


欢迎关注社区 “智能化运维”技术主题 ,将会不断更新优质资料、文章。地址:https://www.talkwithtrend.com/Topic/125353





请到「今天看啥」查看全文