专栏名称: 分布式实验室

最专业的Docker文章，最权威的Docker新闻。关注容器生态圈的发展。

Kubernetes 部署失败的 10 个最普遍原因（二）

分布式实验室 · 公众号 · 后端 · 2017-05-05 07:46

正文

上篇文章我写了 Kubernetes 部署失败的前5个最普遍原因。本文是剩下的几个，其中有几个特别令人沮丧。

6. 资源配额

和资源限额类似，Kubernetes 也允许管理员给每个 namespace 设置资源配额。这些配额可以在 Pods，Deployments，PersistentVolumes，CPU，内存等资源上设置软性或者硬性限制。

让我们看看超出资源配额后会发生什么。以下是我们的 deployment 例子：

# test-quota.yaml

apiVersion: extensions/v1beta1

kind: Deployment

metadata:

name: gateway-quota

spec:

template:

spec:

containers:

- name: test-container

image: nginx

我们可用 kubectl create -f test-quota.yaml 创建，然后观察我们的 Pods：

$ kubectl get pods

NAME READY STATUS RESTARTS AGE

gateway-quota-551394438-pix5d 1/1 Running 0 16s

看起来很好，现在让我们扩展到 3 个副本：kubectl scale deploy/gateway-quota --replicas=3，然后再次观察 Pods：

$ kubectl get pods

NAME READY STATUS RESTARTS AGE

gateway-quota-551394438-pix5d 1/1 Running 0 9m

啊，我们的pod去哪了？让我们观察一下 deployment：

$ kubectl describe deploy/gateway-quota

Name: gateway-quota

Namespace: fail

CreationTimestamp: Sat, 11 Feb 2017 16:33:16 -0500

Labels: app=gateway

Selector: app=gateway

Replicas: 1 updated | 3 total | 1 available | 2 unavailable

StrategyType: RollingUpdate

MinReadySeconds: 0

RollingUpdateStrategy: 1 max unavailable, 1 max surge

OldReplicaSets:

NewReplicaSet: gateway-quota-551394438 (1/3 replicas created)

Events:

FirstSeen LastSeen Count From SubObjectPath Type Reason Message

--------- -------- ----- ---- ------------- -------- ------ -------

9m 9m 1 {deployment-controller } Normal ScalingReplicaSet Scaled up replica set gateway-quota-551394438 to 1

5m 5m 1 {deployment-controller } Normal ScalingReplicaSet Scaled up replica set gateway-quota-551394438 to 3

在最后一行，我们可以看到 ReplicaSet 被告知扩展到 3 。我们用 describe 来观察一下这个 ReplicaSet 以了解更多信息：

kubectl describe replicaset gateway-quota-551394438

Name: gateway-quota-551394438

Namespace: fail

Image(s): nginx

Selector: app=gateway,pod-template-hash=551394438

Labels: app=gateway

pod-template-hash=551394438

Replicas: 1 current / 3 desired

Pods Status: 1 Running / 0 Waiting / 0 Succeeded / 0 Failed

No volumes.

Events:

FirstSeen LastSeen Count From SubObjectPath Type Reason Message

--------- -------- ----- ---- ------------- -------- ------ -------

11m 11m 1 {replicaset-controller } Normal SuccessfulCreate Created pod: gateway-quota-551394438-pix5d

11m 30s 33 {replicaset-controller } Warning FailedCreate E

哦！我们的 ReplicaSet 无法创建更多的 pods 了，因为配额限制了：exceeded quota: compute-resources, requested: pods=1, used: pods=1, limited: pods=1。

和资源限额类似，我们也有 3 个选项：

要求集群管理员提升该 namespace 的配额
删除或者收缩该 namespace 下其它的 deployment
直接编辑配额

7. 集群资源不足

除非你的集群开通了集群自动伸缩功能，否则总有一天你的集群中 CPU 和内存资源会耗尽。

这不是说 CPU 和内存被完全使用了，而是指它们被 Kubernetes 调度器完全使用了。如同我们在第 5 点看到的，集群管理员可以限制开发者能够申请分配给 pod 或者容器的 CPU 或者内存的数量。聪明的管理员也会设置一个默认的 CPU/内存申请数量，在开发者未提供申请额度时使用。

如果你所有的工作都在 default 这个 namespace 下工作，你很可能有个默认值 100m 的容器 CP U申请额度，对此你甚至可能都不清楚。运行 kubectl describe ns default 检查一下是否如此。

我们假定你的 Kubernetes 集群只有一个包含 CPU 的节点。你的 Kubernetes 集群有 1000m 的可调度 CPU。

当前忽略其它的系统 pods（kubectl -n kube-system get pods），你的单节点集群能部署 10 个 pod（每个 pod 都只有一个包含 100m 的容器）。

10 Pods * (1 Container * 100m) = 1000m == Cluster CPUs

当你扩大到 11 个的时候，会发生什么？

下面是一个申请 1CPU（1000m）的 deployment 例子：

# cpu-scale.yaml

apiVersion: extensions/v1beta1

kind: Deployment

metadata:

name: cpu-scale

spec:

template:

metadata:

labels:

app: cpu-scale

spec:

containers:

- name: test-container

image: nginx

resources:

requests:

cpu: 1

我把这个应用部署到有 2 个可用 CPU 的集群。除了我的 cpu-scale 应用，Kubernetes 内部服务也在消耗 CPU 和内存。

我们可以用 kubectl create -f cpu-scale.yaml 部署这个应用，并观察 pods：

$ kubectl get pods

NAME READY STATUS RESTARTS AGE

cpu-scale-908056305-xstti 1/1 Running 0 5m

第一个 pod 被调度并运行了。我们看看扩展一个会发生什么：

$ kubectl scale deploy/cpu-scale --replicas=2

deployment "cpu-scale" scaled

$ kubectl get pods

NAME READY STATUS RESTARTS AGE

cpu-scale-908056305-phb4j 0/1 Pending 0 4m

cpu-scale-908056305-xstti 1/1 Running 0 5m

我们的第二个pod一直处于 Pending，被阻塞了。我们可以 describe 这第二个 pod 查看更多的信息：

$ kubectl describe pod cpu-scale-908056305-phb4j

Name: cpu-scale-908056305-phb4j

Namespace: fail

Node: gke-ctm-1-sysdig2-35e99c16-qwds/10.128.0.4

Start Time: Sun, 12 Feb 2017 08:57:51 -0500

Labels: app=cpu-scale

pod-template-hash=908056305

Status: Pending

IP:

Controllers: ReplicaSet/cpu-scale-908056305

[...]

Events:

FirstSeen LastSeen Count From SubObjectPath Type Reason Message

--------- -------- ----- ---- ------------- -------- ------ -------

3m 3m 1 {default-scheduler } Warning FailedScheduling pod (cpu-scale-908056305-phb4j) failed to fit in any node

fit failure on node (gke-ctm-1-sysdig2-35e99c16-wx0s): Insufficient cpu

fit failure on node (gke-ctm-1-sysdig2-35e99c16-tgfm): Insufficient cpu

fit failure on node (gke-ctm-1-sysdig2-35e99c16-qwds): Insufficient cpu

好吧，Events 模块告诉我们 Kubernetes 调度器（default-scheduler）无法调度这个 pod 因为它无法匹配任何节点。它甚至告诉我们每个节点哪个扩展点失败了（Insufficient cpu）。

那么我们如何解决这个问题？如果你太渴望你申请的 CPU/内存的大小，你可以减少申请的大小并重新部署。当然，你也可以请求你的集群管理员扩展这个集群（因为很可能你不是唯一一个碰到这个问题的人）。

现在你可能会想：我们的 Kubernetes 节点是在我们的云提供商的自动伸缩群组里，为什么他们没有生效呢？

原因是，你的云提供商没有深入理解 Kubernetes 调度器是做啥的。利用 Kubernetes 的集群自动伸缩能力允许你的集群根据调度器的需求自动伸缩它自身。如果你在使用 GCE，集群伸缩能力是一个 beta 特性。

8. 持久化卷挂载失败

Kubernetes 部署失败的 10 个最普遍原因（二）

正文

请到「今天看啥」查看全文