专栏名称: 阿里开发者

阿里巴巴官方技术号，关于阿里的技术创新均将呈现于此

跟着iLogtail学习容器运行时与K8s下日志采集方案

阿里开发者 · 公众号 · 科技公司 · 2024-09-26 08:30

主要观点总结

文章介绍了iLogtail作为开源可观测数据采集器在Kubernetes环境下的日志采集原理。文章详细解释了Kubernetes、容器运行时（如Docker、containerd等）以及iLogtail之间的交互关系，以及iLogtail如何通过这两种模式（Daemonset和Sidecar）进行日志数据采集。同时，文章还介绍了iLogtail在获取容器元信息、处理容器日志数据以及兼容多种容器运行时方面的优势和特点。

关键观点总结

关键观点1: iLogtail与Kubernetes和容器运行时的关系

iLogtail作为开源数据采集器，通过Daemonset和Sidecar两种模式，在Kubernetes环境下进行日志数据采集。它通过与容器运行时的交互，能够获取容器元信息，并兼容多种容器运行时。

关键观点2: iLogtail的日志采集原理

iLogtail支持标准输出和容器内自定义文件的采集，提供容器元信息富化功能，支持多种挂载模式，并具有主机文件采集能力。

关键观点3: iLogtail获取容器元信息的原理

iLogtail通过与容器运行时进行直接交互，实时获取容器元信息，并通过文件路径搜索和直接与containerd交互的方式获取容器Rootfs路径。

关键观点4: iLogtail在Sidecar模式下的应用

iLogtail在Sidecar模式下与阿里云的Serverless容器实现深度集成，能够轻松获取容器的元信息，为日志数据提供更精准的字段丰富化。

关键观点5: iLogtail的优势

iLogtail的设计减少了对API server的依赖，提升了系统的稳定性和响应能力，同时兼容非K8s场景，具有强大的日志采集能力。

正文

阿里妹导读

iLogtail 作为开源可观测数据采集器，对 Kubernetes 环境下日志采集有着非常好的支持，本文跟随 iLogtail 的脚步，了解容器运行时与 K8s 下日志数据采集原理。

如今，Kubernetes在业界几乎已经成为了容器管理的标准。在 Kubernetes 架构中，容器运行时（如Docker、containerd等）充当了基础层的角色，负责容器的创建、执行和管理。由于Kubernetes的设计是高度模块化的，它支持多种容器运行时，这给开发者带来了灵活性。开发者可以根据不同的需求选择最合适的运行时，甚至在同一个集群内使用多种运行时，这是Kubernetes生态的一个显著优势。

iLogtail 作为开源可观测数据采集器，对 Kubernetes 环境下日志采集有着非常好的支持，下面就跟随 iLogtail 的脚步，了解容器运行时与 K8s 下日志数据采集原理。

K8s 与容器运行时简介

正如前面所说，Kubernetes的设计是高度模块化的，那么模块化的基础就是统一的接口或者标准。容器运行时这个概念比较广泛，我们平常所听到的 Docker、Containerd、Runc、Kata 等都可以叫做运行时，但是他们又明显地处于不同层次上，比如 Containerd 会依赖 Runc 去真正地拉起容器。因此在这里做了一些概念划分，在Kubernetes 架构下，像Containerd 这种跟 CRI 进行交互的，叫做高级容器运行时；像 RunC 这种跟 OCI 交互的，叫做基础容器运行时。

接下来我们先了解一下 CRI 和 OCI 的概念。

CRI 与高级容器运行时

CRI（Container Runtime Inteface 容器运行时接口）本质上就是 Kubernetes 定义的一组与容器运行时进行交互的接口，所以只要实现了这套接口的容器运行时都可以对接到 Kubernetes 平台上来。

Kubelet 通过 gRPC 框架与容器运行时或 shim 进行通信，其中 kubelet 作为客户端，CRI shim（也可能是容器运行时本身）作为服务器。通过 CRI 的接口定义可以看到，大概分了两套接口：

1. 针对 container 和 sandbox 的接口；

2. 针对镜像操作的接口；

比方说我们通过 kubectl 命令来运行一个 Pod，那么 Kubelet 就会通过 CRI 执行以下操作：

首先调用 RunPodSandbox 接口来创建一个 Pod 容器，Pod 容器是用来持有容器的相关资源的，比如说网络空间、PID 空间、进程空间等资源；
然后调用 CreatContainer 接口在 Pod 容器的空间创建业务容器；
再调用 StartContainer 接口启动容器，相对应的销毁容器的接口为 StopContainer 与 RemoveContainer。

Docker

Docker的历史可以追溯到2010年，当时由容器技术的先驱Solomon Hykes在法国巴黎的dotCloud公司创立。最初，Docker并不是一个独立的项目，而是dotCloud平台的一部分，旨在提供一种轻量级的虚拟化解决方案。Docker的核心思想是通过使用Linux内核的命名空间和控制组（cgroups）技术，来实现轻量级的容器化，这使得应用程序可以在隔离的环境中运行而不需要整个操作系统的虚拟化。这种方式大大减少了资源开销，提高了应用的部署速度。

在 Kubernetes 的早期，也只支持一个容器运行时，那就是 Docker。Kubernetes 推出 CRI 这套标准的时候，比如 Docker 本身并没有实现 CRI 接口，于是就有了 shim（垫片），一个 shim 的职责就是作为适配器将各种容器运行时本身的接口适配到 Kubernetes 的 CRI 接口上，其中 dockershim 就是 Kubernetes 对接 Docker 到 CRI 接口上的一个垫片实现。

当 Kubelet 想要使用 Docker 运行时创建一个容器时，它需要以下几个步骤：

Kubelet 通过 CRI 接口（gRPC）调用 dockershim，请求创建一个容器，CRI（容器运行时接口，Container Runtime Interface)。在这一步中，Kubelet 可以视作一个简单的 CRI Client，而 dockershim 就是接收请求的 Server。
dockershim 收到请求后，它会转化成 Docker Daemon 的请求，发到 Docker Daemon 上，并请求创建一个容器。
Docker Daemon 在 1.12 版本中将针对容器的操作移到另一个守护进程 containerd 中了。因此 Docker Daemon 请求 containerd 创建一个容器。
containerd 收到请求后，创建一个 containerd-shim 的进程，让 containerd-shim 去操作容器。containerd-shim 在这一步需要调用 Runc 这个命令行工具，来真正启动容器。
Runc 启动完容器后，它会直接退出，containerd-shim 则会成为容器进程的父进程，负责收集容器进程的状态，上报给 containerd。

Containerd

从前面 Kubelet 使用 Docker 启动容器的过程可以看到，从Kubelet 到容器启动的过程中，有非常长的链路和非常多的步骤。但是最核心的步骤是 Containerd->Containerd-shim->Runc，

Docker Daemon 和 Docker-shim 仿佛是可以忽略的。

因此在Kubernetes 提出 CRI 之后，Containerd 迅速完成了适配。在 Containerd v1.0 中，对 CRI 的适配通过一个单独的进程CRI-containerd来完成：

Containerd v1.1 中做的又更漂亮一点，砍掉 CRI-containerd 进程，直接把适配逻辑作为插件放进 containerd 主进程中：

CRI-O

Kubernetes 的主流运行时经历了从 Docker 到 Containerd 的转变，流程变得愈加简化。此外，还有一个比 Containerd 更为纯粹且专注的 Kubernetes 运行时解决方案—CRI-O，它专为 Kubernetes 设计，并且兼容 CRI 和 OCI，提供了更为简单的运行时体验。

Containerd 是一个更通用的容器运行时，旨在提供一个高效的容器管理系统。它支持构建、运行和存储容器镜像，适用于各种编排工具，如 Kubernetes 和 Docker Swarm。Containerd 提供了丰富的 API 和插件机制，使其能够与多种环境和体系结构兼容。

相对而言，CRI-O 是专为 Kubernetes 设计的轻量级容器运行时。它遵循 Kubernetes 的 CRI（容器运行时接口）标准，专注于提供与 Kubernetes 生态系统的无缝集成。CRI-O 旨在简化对 Kubernetes 的容器管理，去掉了不必要的功能，力求在安全性、性能和资源占用上做到极致，减少了额外的复杂性。

OCI 与基础容器运行时

开放容器标准（Open Container Initiative，OCI）是一个由多个技术公司、开发者和社区成员组成的行业合作项目，旨在为容器技术建立开放标准。OCI 于 2015 年成立，目的是为了推动容器生态系统的发展，减少不同容器运行时及映像格式之间的不兼容性。

OCI 目前包含三个规范：

运行时规范 (runtime-spec)：定义了如何运行容器，包括配置、生命周期和沙箱环境。它提供了一种标准的方法，使得容器能够在任何遵循该标准的运行时中被启动。简单来说，它规定的就是“容器”要能够执行“create”“start”“stop”“delete”这些命令，并且行为要规范。
镜像规范 (image-spec) ：规定了容器映像的格式和内容结构，确保镜像可以在不同的容器运行时之间顺利传输和使用。
分发规范 (distribution-spec)：是关于如何在不同的容器注册中心之间分发和获取容器映像的标准。

CRI 和 OCI 一起，构成了 Kubernetes 容器领域的事实规范。任何实现了 CRI 的高级容器运行时，都可以成为 Kubernetes 的运行时。任何实现了 OCI 的低级运行时，也可以成为高级容器运行时的基础依赖。

Runc

Runc的前身实际上是Docker的libcontainer项目演化而来。Runc实际上就是libcontainer配上了一个轻型的客户端。

Runc是一个轻量级的容器运行时，用于根据OCI（Open Container Initiative）标准运行容器。它是最基础的容器运行时解决方案，可以在没有额外服务管理的情况下启动和运行容器。Docker和其他较高级的容器管理工具在内部使用Runc来实际启动和运行容器。Runc的目标是提供一个通用的容器运行时，侧重于简单、可移植和可扩展。

隔离机制：它直接在宿主机上运行容器进程，并使用Linux的namespace和cgroups等内核特性来提供隔离和资源限制。
安全性：虽然 Runc 通过 Linux 的安全特性（如 SELinux、AppArmor、seccomp等）提供基本的安全保障，但它仍然共享同一内核，与其他在同一宿主机上运行的容器相比，隔离性并不是最强的。对于需要强隔离的场景，可能需要其他解决方案。
性能：Runc 为容器提供了接近原生Linux性能，启动速度快，资源开销小，适合大规模部署和微服务架构。
使用场景：广泛用于开发、测试和生产环境，是Docker和许多Kubernetes部署的默认容器运行时。

Runc 作为一种容器运行时，使用共享内核的方式来管理容器的隔离和资源分配。然而，这种共享内核的架构也带来了一些安全隐患，主要体现在以下几个方面：

1. 内核漏洞：所有容器共享同一内核，因此如果内核出现漏洞，攻击者可以利用这些漏洞从一个容器突破到宿主机或其他容器。这使得容器之间的隔离不如完全虚拟化的方式安全。

2. 系统调用滥用：容器内的进程可以通过系统调用与内核交互。一些系统调用可能被恶意容器滥用以获取更高的权限或访问宿主机的资源。

3. 特权容器：如果某个容器被配置为特权容器，它将拥有更高的权限，可能直接访问宿主机的硬件或敏感资源，从而导致安全风险。

4. 配置错误：容器的配置不当可能导致安全漏洞，如未正确配置的网络或存储，可能使容器之间能够互相访问，从而影响隔离性。

Kata/RunD

正如前面所说的， Runc 在安全方面的各种问题，因此需要一种更加安全的运行时。

Kata安全容器和普通容器相比有2个主要的区别:

1.容器运行在虚拟机里；

2.镜像要从宿主机上传递给虚拟机；

Shim-v2 会为 Pod 启动一个虚拟机作为 PodSandbox提供隔离性，其中运行着一个 Linux 内核，通常这个 Linux 内核是一个裁剪过的内核，不会支持没有必要的设备。
这里用的虚拟机可以是 Qemu 或是 Firecracker，它只是支撑容器应用运行的基础设施没有完整操作系统。

RunD 是阿里提出的新型安全容器，简言之就是增强版的 Kata，在资源占用、网络、存储等方面均有优化。

K8s 下容器日志数据采集难点

在 Kubernetes（K8s）环境下，容器日志数据采集面临着多重挑战：

1. 生命周期短容器的短暂性和高度动态特性使得它们的生命周期极其短暂，这意味着许多容器可能在运行期间生成重要的日志信息，但一旦容器被销毁，这些信息就会随之消失。日志的瞬时性给日志采集带来了极大的挑战。

2. 分布式架构容器通常部署在多个节点上，这种分布式架构导致日志数据存储在不同的位置。数据的分散性不仅增加了管理的复杂性，而且可能导致实时数据采集和分析的困难。

3. 存储方式多样容器的存储方式各异，包括卷、挂载等。这些存储方式的多样性使得日志的写入、读取和管理变得更加复杂。

4. 数据与容器元信息关联容器日志作为可观测数据，必须与容器的元信息（如容器 ID、名称、标签等）进行精准关联，以便于后续的查询与分析，有效地匹配数据与容器信息有助于快速定位问题源头。然而，由于容器的频繁创建和销毁，以及其动态变化的特性，在数据采集时及时、准确地建立这种关联，依然是一大挑战。

开源采集器容器日志采集方案

Filebeat

容器标准输出采集

通过官方文档[1]可以看到，Filebeat 推荐是以 daemonset 的方式部署在 K8s 集群中的，然后这里需要把节点宿主机上的：/var/log 和/var/lib/docker/containers挂载进 filebeat的pod中。这个采集原理跟前面运行时就有关系了。

当Docker 作为 K8s 容器运行时，容器日志的落盘将由 docker 来完成，保存在：

/var/lib/docker/containers/ 目录下。Kubelet 会在 /var/log/pods 和 /var/log/containers 下建立软链接，指向 /var/lib/docker/containers/ 目录下的容器日志文件。

当Containerd 作为 k8s 容器运行时，容器日志的落盘由 Kubelet 来完成，保存至 /var/log/pods/ 目录下，同时在 /var/log/containers 目录下创建软链接，指向日志文件。

所以，总结下来：

1. /var/lib/docker/containers/ : Docker 日志落盘路径，文件路径格式/var/lib/docker/containers/${container_id}/${container_id}-json.log

2. /var/log/containers/ : 一般都是软连接，文件路径格式/var/log/containers/${pod_name}_${namespace}_${container_name}-${container_id}.log

3. /var/log/pods/ ： kubelet 日志落盘路径，文件路径格式/var/log/pods/${namespace}_${pod_name}_${pod_uid]}/${container name}/0.log

所以一般采集标准输出文件，都是采集/var/log/containers 路径，因为这个路径下有完整的所有容器的标准输出文件。

从官方文档[1]，可以看到， Filebeat 支持在 K8s 环境自动发现容器并采集容器数据。

K8s 配置样例：

filebeat.autodiscover:  providers:    - type: kubernetes      templates:        - condition:            equals:              kubernetes.namespace: kube-system          config:            - type: container              paths:                - /var/log/containers/*-${data.kubernetes.container.id}.log              exclude_lines: ["^\\s+[\\-`('.|_]"]  # drop asciiart lines

从源码[2]中我们可以看到，Filebeat 在 Kubernetes 场景下，采用了向 API Server 进行 List-Watch 的方式来处理与集群相关的各种资源，例如 Pod、Namespace、Node 等。首先，Filebeat 会向 API Server 发送请求以获取当前所有相关资源的列表，并持续监控这些资源的变化。当有新的资源被创建、更新或删除时，API Server 会通过事件通知的方式将变更信息推送给 Filebeat。

在获取到这些资源后，Filebeat 会将它们存储在本地缓存中，以便后续的访问和处理。通过这种List-Watch 机制，Filebeat 能够实时获取资源的状态，确保信息的时效性和准确性。接下来，Filebeat 会进行条件过滤，数据上报的时候，还可以进行数据的富化处理，比如添加上下文信息、标签或其他的容器元信息数据，从而使得最终的日志更加丰富和有意义。

容器内自定义文件采集配置

目前，针对容器内自定义文件采集配置，Filebeat 提供 sidecar 模式的部署。比如如下样例，Filebeat 作为一个 sidecar container，跟业务容器部署在同一个 Pod 内，同时，业务容器要采集的日志文件路径需要通过数据卷挂载的方式共享给 Filebeat，这样才能完成容器内自定义文件采集。

apiVersion: apps/v1kind: Deploymentmetadata:  name: app-log-logfilespec:  replicas: 3  selector:    matchLabels:      project: microservice      app: nginx-logfile  template:    metadata:      labels:        project: microservice        app: nginx-logfile    spec:      containers:      # 应用容器      - name: nginx         image: lizhenliang/nginx-php        # 将数据卷挂载到日志目录        volumeMounts:        - name: nginx-logs           mountPath: /usr/local/nginx/logs      # 日志采集器容器      - name: filebeat        image: elastic/filebeat:7.10.1         args: [          "-c", "/etc/filebeat.yml",          "-e",        ]        resources:          requests:            cpu: 100m            memory: 100Mi          limits:            memory: 500Mi        securityContext:          runAsUser: 0        volumeMounts:        # 挂载filebeat配置文件        - name: filebeat-config          mountPath: /etc/filebeat.yml          subPath: filebeat.yml        # 将数据卷挂载到日志目录        - name: nginx-logs           mountPath: /usr/local/nginx/logs      # 数据卷共享日志目录      volumes:      - name: nginx-logs        emptyDir: {}      - name: filebeat-config        configMap:          name: filebeat-nginx-config

Sidecar 模式虽然能够采集到容器内的日志文件，但是它也有一些劣势：

1. 资源占用提升：一个 Pod 就要部署一个采集器，CPU、内存等资源占用势必增加。

2. 无法跟容器元信息关联： Sidecar 模式采集文件就跟主机上普通文件采集类似，很难跟容器元信息关联上。

聪明的社区用户提出了一个创新性的方案[3]不直接使用 sidecar 模式来部署 filebeat。首先，引入一个轻量级的 sidecar 容器，主容器在运行时将日志文件共享给这个 sidecar 容器。接下来，在 sidecar 容器中，仅需运行简单的 tail 命令，将主容器输出的日志文件转换成标准输出的方式，然后就可以通过 filebeat 的 damonset 方式进行容器标准输出的采集。

apiVersion: v1kind: Podmetadata:  name: counterspec:  containers:  - name: count    image: busybox    args:    - /bin/sh    - -c    - >      i=0;      while true;      do        echo "$i: $(date)" >> /var/log/1.log;        echo "$(date) INFO $i" >> /var/log/2.log;        i=$((i+1));        sleep 1;      done    volumeMounts:    - name: varlog      mountPath: /var/log  - name: count-log-1    image: busybox    args: [/bin/sh, -c, 'tail -n+1 -F /var/log/1.log']    volumeMounts:    - name: varlog      mountPath: /var/log  - name: count-log-2    image: busybox    args: [/bin/sh, -c, 'tail -n+1 -F /var/log/2.log']    volumeMounts:    - name: varlog      mountPath: /var/log  volumes:  - name: varlog    emptyDir: {}

Fluent bit

容器标准输出采集

从 Fluent Bit 的官方文档[4]可以看到，Fluent Bit 也是推荐使用 Daemonset 的部署模式部署到每一个节点上，然后，可以支持如下信息富化：

Pod Name
Pod ID
Container Name
Container ID
Labels
Annotations

为了获取此信息，Fluent Bit 的内置过滤器插件会与 Kubernetes API Server 通信以检索相关信息，例如 pod_id、label 和 annotation，其他字段（例如 pod_name、container_id 和 container_name）从日志文件名本地获取的（/var/log/containers/目录下文件路径格式为：/var/log/containers/${pod_name}_${namespace}_${container_name}-${container_id}.log）。

K8s 日志采集配置样例[5]：

input-kubernetes.conf: |    [INPUT]        Name              tail        Tag               kube.*        Path              /var/log/containers/*.log        Parser            docker        DB                /var/log/flb_kube.db        Mem_Buf_Limit     5MB        Skip_Long_Lines   On        Refresh_Interval  10    [FILTER]        Name                kubernetes        Match               kube.*        Kube_URL            https://kubernetes.default.svc:443        Kube_CA_File        /var/run/secrets/kubernetes.io/serviceaccount/ca.crt        Kube_Token_File     /var/run/secrets/kubernetes.io/serviceaccount/token        Kube_Tag_Prefix     kube.var.log.containers.        Merge_Log           On        Merge_Log_Key       log_processed        K8S-Logging.Parser  On

在 INPUT 配置段中，tail 插件将监控路径 /var/log/containers/ 路径以 .log 结尾的所有文件。对于每个文件，它将读取每一行日志记录并应用 docker 解析器。然后，日志记录将被附加标签并发送到下一步。

从源代码[6]可以看到，Fluent bit 容器元信息富化与 Filebeat 不太一样，Filebeat 采取的是 List-Watch api server 的方式，而 Fluent bit 则是从文件名中解析得到 namespace 和 pod name，然后向api server 请求单个 pod 的元信息。

如果想要过滤掉某个 pod 的日志，那么 Fluent bit 还支持使用注解的方式，请求将指定日志排除，如下样例就是使用fluentbit.io/exclude 这个注解，将该 pod 的日志排除掉。

apiVersion: v1kind: Podmetadata:  name: apache-logs  labels:    app: apache-logs  annotations:    fluentbit.io/exclude: "true"spec:  containers:  - name: apache    image: edsiper/apache_logs

容器内自定义文件采集配置

对于容器内自定义文件的采集，Fluent bit 同样采取的是 sidecar 的部署模式。

小结

K8s 场景，开源采集器一般都支持 Daemonset 和 Sidecar 两种部署模式：

Daemonset 部署模式：一般都是用来采集 K8s 场景下容器标准输出日志，容器元信息获取都是通过与 K8s 的 api server 交互获取，但是实现细节上有所不同，Filebeat 采用的是 List-Watch 机器，获取全量的资源信息，FluentBit 则是按需获取对应 Pod 信息。

Sidercar 部署模式：一般都是用来采集容器内自定义日志文件，没有办法获取容器元信息数据，难以富化日志字段。

iLogtail 容器日志采集方案

Daemonset 模式

部署说明

iLogtail Daemonset 部署模版可以参考文档[7]

其中比较关键的配置如下：

          volumeMounts:            - mountPath: /var/run # for container runtime socket              name: run            - mountPath: /logtail_host # for log access on the node              mountPropagation: HostToContainer              name: root              readOnly: true

      volumes:        - hostPath:            path: /var/run            type: Directory          name: run        - hostPath:            path: /            type: Directory          name: root

一个是将节点的/var/run 目录挂载待 iLogtail-ds 里面，主要作用是让 iLogtail-ds 可以访问到容器运行时的 sock 文件，比如

Docker： /run/docker.sock。
Containerd： /run/containerd/containerd.sock。

还有一个是把节点根目录挂载到 iLogtail-ds 里面，主要作用就是让 iLogtail-ds 可以访问节点上的路径，从而实现标准输出日志和容器内自定义日志文件的采集。

iLogtail 在 Daemonset 部署模式下支持以下功能：

1. 灵活的采集配置

iLogtail 提供强大的配置选项，使用户能够根据不同的 Pod 和 Container 条件进行精确的筛选。用户可以根据标签、命名空间、环境变量等多种条件灵活定义目标容器，从而确保所需日志的高效采集与处理。

2. 容器元信息富化

为了提升日志数据的价值，iLogtail 支持对容器的元信息进行富化。这意味着用户可以自动获取并附加如 Pod 名称、命名空间、节点名称、容器状态等关键信息，使得后续的数据分析和监控变得更加直观和高效。

3. 支持标准输出和容器内自定义文件采集

iLogtail 支持采集采集标准输出日志和容器内任意文件日志采集

4. 全量挂载模式支持

iLogtail 支持多种挂载模式，以适应业务不同的部署需求。无论是使用 hostPath、emptyDir 还是其他持久化存储的挂载方式，都可以支持，确保日志采集的稳定性与灵活性。

5. 主机文件采集能力

除了容器内的日志采集，iLogtail 还支持直接在主机上进行文件的采集。这一功能使得用户能够灵活地从主机文件系统中提取重要的日志数据，满足不同场景下的日志收集需求，并提供全面的日志分析能力。

容器元信息获取原理介绍

在容器元信息获取方面，iLogtail 的设计思路与开源 API server 请请求的解决方案有所不同。它采用了直接与容器运行时进行交互的方式，以确保高效、可靠地获取所需的元数据。目前，iLogtail 支持多种主流的容器运行时，具体包括：

使用 Docker Client，支持 Docker 运行时

iLogtail 利用 Docker Client 与 Docker Daemon 进行通信，直接获取容器的元信息。通过这种方式，可以实现对容器的深入监控和管理。主要使用到的接口包括：

ContainerList：获取当前运行容器的列表，这使得 iLogtail 能够快速了解当前节点上有哪些容器在运行。
ContainerInspect：提供每个容器的详细信息，包括配置、状态等关键信息。
Events：实时监听容器变化事件，允许动态跟踪容器的生命周期，及时更新相关处理逻辑。

通过 Docker Client 获取的容器元信息示例中，有几项信息尤为重要：

LogPath：这是容器标准输出日志文件在宿主机上的存放路径，方便用户进行日志收集和分析。
GraphDriver.Data：提供容器 rootfs 在节点宿主机上的路径，关键于了解容器文件系统的存储方式，有助于进行故障诊断和性能优化。

这种直接与运行时交互的机制，不仅增强了数据获取的实时性，还提高了对于容器状态的管控能力，使得 iLogtail 能够更好地适应云原生环境下的动态和复杂性。

[    {        "Id": "1eb334fb59429d77dbfc9ab50f17d72558099532dd33486efd23e817dc3a1fe8",        "Created": "2024-01-15T06:58:13.23781656Z",        "Path": "nginx",        "Args": [],        "State": {},        "Image": "sha256:261c66bffbc8e04810eb3c292a1c666ee92a11fb874f4585471d70635afafc90",        "ResolvConfPath": "/var/lib/docker/containers/8b187cf41801560981deaf0b4389516ec532a58508899895bcb88aa683feb898/resolv.conf",        "HostnamePath": "/var/lib/docker/containers/8b187cf41801560981deaf0b4389516ec532a58508899895bcb88aa683feb898/hostname",        "HostsPath": "/var/lib/kubelet/pods/5fca5fc9-55fe-40cd-a2b2-9abe81796486/etc-hosts",        // 标准输出日志文件路径        "LogPath": "/var/lib/docker/containers/1eb334fb59429d77dbfc9ab50f17d72558099532dd33486efd23e817dc3a1fe8/1eb334fb59429d77dbfc9ab50f17d72558099532dd33486efd23e817dc3a1fe8-json.log",        "Name": "/k8s_nginx-1215_nginx-1215-b749b6c4f-q4pzb_default_5fca5fc9-55fe-40cd-a2b2-9abe81796486_0",        "RestartCount": 0,        "Driver": "overlay2",        "Platform": "linux",        "MountLabel": "",        "ProcessLabel": "",        "AppArmorProfile": "",        "ExecIDs": null,        "HostConfig": {            "LogConfig": {                // 日志配置                "Type": "json-file",                "Config": {                    "max-file": "10",                    "max-size": "100m"                }            }        },        "GraphDriver": {            // rootfs路径            "Data": {                "LowerDir": "/var/lib/docker/overlay2/1e8847504f60ee1e159aa12f09fe9c92e4f5165ff01991b29fd1a0c36d2aec9e-init/diff:/var/lib/docker/overlay2/b1fc28e304c04200359f045995ad78cdcd418c13ce058255f6c85b4d5bff2000/diff:/var/lib/docker/overlay2/ec56a2a3384cc1c0753295bbb1dcc268db23bc13077622e27f7c7d16663f8c7a/diff:/var/lib/docker/overlay2/f2c8d0f32b19d1725a8fb377230b8c18f3ad3b794b77fbfcf3b259fb8e502fd0/diff:/var/lib/docker/overlay2/2b578df4e8cd6d7ce189ccd413096f5a54218a4f90ca34e3ca16732401301833/diff",                "MergedDir": "/var/lib/docker/overlay2/1e8847504f60ee1e159aa12f09fe9c92e4f5165ff01991b29fd1a0c36d2aec9e/merged",                "UpperDir": "/var/lib/docker/overlay2/1e8847504f60ee1e159aa12f09fe9c92e4f5165ff01991b29fd1a0c36d2aec9e/diff",                "WorkDir": "/var/lib/docker/overlay2/1e8847504f60ee1e159aa12f09fe9c92e4f5165ff01991b29fd1a0c36d2aec9e/work"            },            // rootfs类型            "Name": "overlay2"        },        // 挂载信息，如果Pod有配置卷挂载等，这里会有体现        "Mounts": [        ],        "Config": {        },        "NetworkSettings": {        }    }]

使用 CRI，支持 Containerd 和 CRI-O 运行时

通过 CRI（Container Runtime Interface），iLogtail 充分支持在 containerd 和 cri-o 运行时环境下的多种应用场景。无论底层使用的是 runc 还是 Kata Containers，iLogtail 都能够高效地采集和获取容器的元信息。这意味着，无论容器运行在何种环境下，iLogtail 都能保证准确、统一的日志数据采集，帮助用户实时监控和分析日志数据。如下就是一个 containerd 的运行时通过 CRI 接口拿到的信息：

{  "status": {    "id": "7b46331103c28c3cd0198e22fa85f81e2fef50141e1074f67cfdad942c76ebea",    "metadata": {      "attempt": 0,      "name": "nginx"    },    "state": "CONTAINER_RUNNING",    "createdAt": "2024-03-12T14:54:48.225783056+08:00",    "startedAt": "2024-03-12T14:54:48.329066862+08:00",    "finishedAt": "1970-01-01T08:00:00+08:00",    "exitCode": 0,    "image": {      "image": "docker.io/library/nginx:latest"    },    "imageRef": "docker.io/library/nginx@sha256:c26ae7472d624ba1fafd296e73cecc4f93f853088e6a9c13c0d52f6ca5865107",    "reason": "",    "message": "",    "labels": {      "io.kubernetes.container.name": "nginx",      "io.kubernetes.pod.name": "nginx-778b4fd69-p4xf2",      "io.kubernetes.pod.namespace": "default",      "io.kubernetes.pod.uid": "9bd59318-b2ba-4357-8faa-6906d7c827ba"    },    "annotations": {      "com.aliyun.ack.hashVersion": "v1.22.3-aliyun.1",      "io.kubernetes.container.hash": "47cfd8d4",      "io.kubernetes.container.restartCount": "0",      "io.kubernetes.container.terminationMessagePath": "/dev/termination-log",      "io.kubernetes.container.terminationMessagePolicy": "File",      "io.kubernetes.pod.terminationGracePeriod": "30"    },    "mounts": [    ],    // 标准输出日志文件路径    "logPath": "/var/log/pods/default_nginx-778b4fd69-p4xf2_9bd59318-b2ba-4357-8faa-6906d7c827ba/nginx/0.log"  },  "info": {    "sandboxID": "34560e346f5245926d1466b59b2f0906aae95b392277f55a52c5895cc3a65f6e",    "pid": 500599,    "removing": false,    "snapshotKey": "7b46331103c28c3cd0198e22fa85f81e2fef50141e1074f67cfdad942c76ebea",    "snapshotter": "overlayfs",    "runtimeType": "io.containerd.runc.v2",    "runtimeOptions": {      "systemd_cgroup": true    },    "config": {      "metadata": {        "name": "nginx"      },      "image": {        "image": "sha256:e4720093a3c1381245b53a5a51b417963b3c4472d3f47fc301930a4f3b17666a"      },      "envs": [      ],      "mounts": [      ],      "labels": {        "io.kubernetes.container.name": "nginx",        "io.kubernetes.pod.name": "nginx-778b4fd69-p4xf2",        "io.kubernetes.pod.namespace": "default",        "io.kubernetes.pod.uid": "9bd59318-b2ba-4357-8faa-6906d7c827ba"      },      "annotations": {        "io.kubernetes.container.hash": "47cfd8d4",        "io.kubernetes.container.restartCount": "0",        "io.kubernetes.container.terminationMessagePath": "/dev/termination-log"

跟着iLogtail学习容器运行时与K8s下日志采集方案

主要观点总结

关键观点总结

关键观点1: iLogtail与Kubernetes和容器运行时的关系

关键观点2: iLogtail的日志采集原理

关键观点3: iLogtail获取容器元信息的原理

关键观点4: iLogtail在Sidecar模式下的应用

关键观点5: iLogtail的优势

正文

Docker

Containerd

CRI-O

Runc

Kata/RunD

容器标准输出采集

容器内自定义文件采集配置

容器标准输出采集

容器内自定义文件采集配置

部署说明

容器元信息获取原理介绍

使用 Docker Client，支持 Docker 运行时

使用 CRI，支持 Containerd 和 CRI-O 运行时

请到「今天看啥」查看全文