专栏名称: 高效运维
高效运维公众号由萧田国及朋友们维护,经常发布各种广为传播的优秀原创技术文章,关注运维转型,陪伴您的运维职业生涯,一起愉快滴发展。
目录
相关文章推荐
51好读  ›  专栏  ›  高效运维

科学的选择 —— 论旁路监控式管理工具的选择

高效运维  · 公众号  · 运维  · 2017-06-19 06:57

正文

请到「今天看啥」查看全文


一. 困难 的选择

生活 运维工作中, 我们 常常会因为需要购买某一 产品而开始进行比较。这种比较 目标在于, 众多同类型产品中, 找到 自己 心中 所认为最 的那一件, 将其 放入 自己的待购列表 或是 工具建设的计划当中。


对于各类产品而言, 的定义不尽相同,但 有一点 可以肯定的是,最 的产品意味着更高的价值,并且其价值与 的程度 可能 简单的正比关系, 导致 我们在进行权衡选择的时候相当困难。


Intel CPU举例


我们看看一个我们生活中 曾经 碰到的场景: 我们的 桌面 电脑选择一个 CPU。


我们 先不考虑价格, CPU 主频 乘以 核心数 这个简单的指标来评判 CPU“ 的程度。从网上简单搜索一番, 目前 市场上能买到 比较 强大的家用 CPU 似乎 Intel i7-6950X 搭载了 10 CPU 每个 核的主频为 3.0 GHz 主频 乘以 核心数 的结果是 30 列表售价为 14999


接下 我们 就需要考虑价格问题了, 除非 我们是土豪, 或者 老板告诉 我们 预算不成 问题 …… 虽然 Intel i7-6950X 很暴力, 我们还得看看是否存在性价比更高的选择:同样是 i7 系列 Intel Core i7-4770 K 搭载 4 核, 单核 主频为 3.5 GHz ,主频 X 核心数的结果是 14 售价只 区区的 1999


那么 问题 来了, 6950 X 的程度为 30 4770 K 的程度的 2.15 左右, 但是 6950 X的售价 确为 4770 K 7.5 左右, 两者 的程度与价格之间的比例 差异 是巨大的。



二. 尖端 的价值


但是这意味着, 6950 X 是一个性价比较低的选择吗?我们为了得到一个 2.15 CPU 却要 付出 7.5 的价格,这 Intel 定价 员想钱想疯了吗?其实并不 尽然 作为 消费者我们来尝试客观分析一下,抛开产能、 受众 主观喜好 原因 绝大 多数商品的定价 都会 考虑到以下两个问题:


1. 技术 成本: 在大约 9 平方厘米的面积上, 6950 X 堆放了 10 3.0 GHz 主频的 CPU 核心, 对于 制作 的工艺 仪器 的精密度、以及 研发 人员要求的总成本显然会 相比 4770 K 更高得多;


2. 可替 性:很显然, 在i 9 系列 CPU 面市 之前,应该很难买到比 6950 X 更强大的 CPU 了, 类似于影片制作、 医疗 图像分析等高 运算量 需求场景下,显然 6950 X 具有不可替代性。


综上所述, 笔者 把这归结为获得 尖端 技术的 代价 换个 角度来说, 这种与 的程度不成比例的原因,便 体现 了尖端技术的价值。因为获得 尖端 技术需要更高的整体成本,并且尖端技术 具有不可 替代的特性。


我们再 细想一下,如果我们购买 7 4770 K 整体成本上比购买 1 6950 X还低 一点,但这样做可以等同于购买 1 6950 X 的效果吗?显然不行,因为 大部分 情况下每台 桌面 电脑只能安装 1 CPU 每个人一般不可能操作 同时 7 电脑, 所以 这样等同替代显然 不靠谱的。


当然, 如果 恰巧额外 6 废弃的机箱和显示器, 并且 额外有 6 免费的人力资源, 不会 产生额外的衍生成本,也许购买 7 4770 K 的方案也是可以的。


因此 我们还可以发现,虽然尖端技术的价值不菲, 但是 却往往可以帮助我们节约其他的衍生成本, 也是尖端技术的价值体现。

. 业务性能 管理之


既然 是高效运维, 我们 还是回到运维 话题中来。


无论 在任何 时候 业务 系统的性能 监控 都是棘手的问题,因为侵入式的植入 Agent 或读取日志等方式, 不仅 会对业务系统的正常运行 造成 额外风险, 提供 的结果不够 及时 并且 安装部署 时困难重重。


然而 近年 来随着技术的发展,基于网络旁路数据监控的业务系统监控方式得到了行业内 运维者 的广泛认可:这种方式具有不需要对业务系统进行改造、无运行风险、 实时 性高、部署快速等传统应用管理 方案 所不具备的优势。


Gartner 全球 800 多个客户进行访谈后 甚至 得出结论: 使用网络的真实网络数据源(Wire Data 就是前文提到的网络旁路数据经过解码处理后的结果 )会成为性能管理领域五年内成为最主流手段




但是 问题来了,为了提高运维管理工具的先进性,我们 引进新的技术及产品 就不得不 面临选择的问题。那么 选择一个 旁路监控 的性能监控产品, 这样 以往 较少 接触的产品时, 我们 该如何选择?

四. 定义


购买 CPU 的例子相同, 无论 是个人购买行为 或是 企业购买行为, 进行选择 之前 ,我们都需要 进行定义。 因此 在选择一个优秀的旁路监控式性能管理产品之前, 自然 需要对这类产品 的标准进行定义:


1. 成熟可靠:相比个人的选择行为, 企业级 产品的选择似乎 应当看 产品的成熟度与可靠性, 参照 同行业对于同类产品的使用经验, 或是参考备选 产品的 客户 案例数量是比较好的 方式 。总结前人的经验可以帮助我们在选择一个产品时, 走许多弯路;


2. 性能:旁路式监控产品对网络 旁路 数据进行监控, 输出 业务 数据的 解析 结果用于进行分析。 因此 很显然, 对企业内部相对 明确 的流量及业务交易数量进行监控 时,所需使用的服务器或设备数量 少的产品, 性能 便越好。


前文选择 CP U 的例子相似, 当我们 选择了性能最好的 旁路监控 产品时, 便 可以有效减少用于安装 系统 的服务器、节约 服务器 能耗 和管理成本, 降低 了系统建设的衍生成本。( 如果 觉得 服务器很便宜、 电费 也很便宜,你也不是环保主义者, 那么 也想一下这些服务器占用的空间吧, 因为 现在最贵的东西 显然 房子!)


3. 解码:旁路监控式性能管理系统, 最核心 的能力便是把无法阅读的网络数据流解码为易于阅读与处理的互联数据。然而在这项技术上, 不同 产品却有不同的实现方式: 部分 产品借鉴了安全 管理 系统的做法, 通过匹配 关键字的方式对网络流量进行检测并输出匹配结果; 另外一些 产品则采用了 网络 报文全拆解的方式,对网络数据报文进行完整解析, 输出完整解析的结果。


相比 而言, 采用网络 报文全拆解 解码 方式的系统不仅能够解码输出更为完整的 网络 数据解析结果, 还能 有效避免 关键字 匹配方式的配置 疏漏所 造成的信息缺失,以及无法验证数据完整性等相关问题;



4. 数据价值挖掘:解码输出 业务 交易信息的目的是为了实现业务性能监控、 业务 分析、外部系统调用等需求场景。 因此 的旁路监控 业务性能监控产品应当提供灵活、 配置 数据 展示能力 以及 数据接口。


高度灵活、可配置 的视图功能使得产品的解析结果可以快速 满足 各类运维、 业务 分析场景的使用需求; 易于调用、 按需而变(包括 提供 的数据类型、 格式 时间 等)的数据接口, 可快速与 各类 外部的 业务分析 工具或 运维 工具进行对接,进一步提高实时业务数据 使用价值。

五. 做出选择

既然我们已经为 旁路监控 式监控 产品的 进行了定义, 时候做出我们的 选择 了:

1. 考虑价格问题, 找到 备选的产品, 依据 的定义来对 们进行考量;


2. 其次我们会考虑性价比, 那么 我们不妨考虑得更 严谨 一些:单纯来看, 产品价格自然更高, 因为 它具备更高的尖端技术价值; 但是 ,购买了 的产品却可以有效降低其他的衍生成本;


3. 想想 的产品所 具备 的不可替代性:例如,如果 开车 时必须跑到 200 公里 的时速,则必须购买 一辆 最高时速为 200 公里 的车, 并非购买 两辆 最高时速为 100 公里 的车来替代, 即使 是这样做的成本更低, 但是 我们并不可能同时 驾驶 两辆车:)。

科学的选择,让你体验7x24小时 365 天,业务运行 0 故障。








请到「今天看啥」查看全文