今天分享的是:基于大模型驱动的云网全景可观测系统建设实践
报告共计:17页
《基于大模型驱动的云网全景可观测系统建设实践》报告由国泰君安证券股份有限公司的高坤发布,主要探讨了在金融云环境下建设云网全景可观测系统的实践经验。
随着核心业务系统迁移上云,对云资源池业务分析及消费的需求越发突出,当前存在缺少应用服务可视化能力、监控手段不能满足排障要求、缺乏零侵扰的全链路分布式追踪和历史故障问题回溯分析能力等问题。为解决这些问题,需要建设全链路数据监控、性能分析及故障快速定位的可观测性平台,提升系统稳定性与运营效率。
该系统应覆盖虚拟化、云原生、云中间件、云数据库等云内应用,实现对云网络的可观测能力覆盖;结合多源数据,实现对海量数据深入挖掘和分析;依托AI中心和多平台联动,提供不同运维场景的数据服务。具体包括精细化数据采集和控制、可观测运维排障分析、统一对外接口、数据可量化、云资源自动学习和无侵入采集、云网分析标准化等功能。
此外,还介绍了云监控服务、eBPF技术在可观测性系统中的应用,以及使用大模型技术提升可观测数据处理和分析效率的方法,包括基于大模型的数据处理与分析、多源异构数据的整合与融合、零侵扰的大模型应用持续剖析能力和可扩展的系统架构设计等。
最后,报告提到基于开源LLM开发框架和RAG引擎开发的AI云助手,可实现自动解答用户问题、提供运营指南等功能,并与科技服务云门户无缝集成。未来,云环境全链路检测将向全栈主动检测发展,加强与业务监控联动,大模型将有更多落地场景,多智能体协同将成为趋势。
总之,该报告为金融行业在云原生环境下建设高效、可靠的可观测性系统提供了有益的参考和实践经验。
以下为报告节选内容