# DaemonSet
## 什么是 DaemonSet?
_DaemonSet_ 確保全部(或者一些)Node 上運行一個 Pod 的副本。當有 Node 加入集群時,也會為他們新增一個 Pod 。當有 Node 從集群移除時,這些 Pod 也會被回收。刪除 DaemonSet 將會刪除它創建的所有 Pod。
使用 DaemonSet 的一些典型用法:
- 運行集群存儲 daemon,例如在每個 Node 上運行 `glusterd`、`ceph`。
- 在每個 Node 上運行日志收集 daemon,例如`fluentd`、`logstash`。
- 在每個 Node 上運行監控 daemon,例如 [Prometheus Node Exporter](https://github.com/prometheus/node_exporter)、`collectd`、Datadog 代理、New Relic 代理,或 Ganglia `gmond`。
一個簡單的用法是,在所有的 Node 上都存在一個 DaemonSet,將被作為每種類型的 daemon 使用。
一個稍微復雜的用法可能是,對單獨的每種類型的 daemon 使用多個 DaemonSet,但具有不同的標志,和/或對不同硬件類型具有不同的內存、CPU要求。
## 編寫 DaemonSet Spec
### 必需字段
和其它所有 Kubernetes 配置一樣,DaemonSet 需要 `apiVersion`、`kind` 和 `metadata`字段。有關配置文件的通用信息,詳見文檔 [部署應用](https://kubernetes.io/docs/user-guide/deploying-applications/)、[配置容器](https://kubernetes.io/docs/user-guide/configuring-containers/) 和 [資源管理](https://kubernetes.io/docs/concepts/tools/kubectl/object-management-overview/) 。
DaemonSet 也需要一個 [`.spec`](https://git.k8s.io/community/contributors/devel/api-conventions.md#spec-and-status) 配置段。
### Pod 模板
`.spec` 唯一必需的字段是 `.spec.template`。
`.spec.template` 是一個 [Pod 模板](https://kubernetes.io/docs/user-guide/replication-controller/#pod-template)。
它與 [Pod](https://kubernetes.io/docs/user-guide/pods) 具有相同的 schema,除了它是嵌套的,而且不具有 `apiVersion` 或 `kind` 字段。
Pod 除了必須字段外,在 DaemonSet 中的 Pod 模板必須指定合理的標簽(查看 [pod selector](#pod-selector))。
在 DaemonSet 中的 Pod 模板必需具有一個值為 `Always` 的 [`RestartPolicy`](https://kubernetes.io/docs/user-guide/pod-states),或者未指定它的值,默認是 `Always`。
### Pod Selector
`.spec.selector` 字段表示 Pod Selector,它與 [Job](https://kubernetes.io/docs/concepts/jobs/run-to-completion-finite-workloads/) 或其它資源的 `.spec.selector` 的原理是相同的。
`spec.selector` 表示一個對象,它由如下兩個字段組成:
* `matchLabels` - 與 [ReplicationController](https://kubernetes.io/docs/concepts/workloads/controllers/replicationcontroller/) 的 `.spec.selector` 的原理相同。
* `matchExpressions` - 允許構建更加復雜的 Selector,可以通過指定 key、value 列表,以及與 key 和 value 列表的相關的操作符。
當上述兩個字段都指定時,結果表示的是 AND 關系。
如果指定了 `.spec.selector`,必須與 `.spec.template.metadata.labels` 相匹配。如果沒有指定,它們默認是等價的。如果與它們配置的不匹配,則會被 API 拒絕。
如果 Pod 的 label 與 selector 匹配,或者直接基于其它的 DaemonSet、或者 Controller(例如 ReplicationController),也不可以創建任何 Pod。
否則 DaemonSet Controller 將認為那些 Pod 是它創建的。Kubernetes 不會阻止這樣做。一個場景是,可能希望在一個具有不同值的、用來測試用的 Node 上手動創建 Pod。
### 僅在相同的 Node 上運行 Pod
如果指定了 `.spec.template.spec.nodeSelector`,DaemonSet Controller 將在能夠匹配上 [Node Selector](https://kubernetes.io/docs/concepts/configuration/assign-pod-node/) 的 Node 上創建 Pod。
類似這種情況,可以指定 `.spec.template.spec.affinity`,然后 DaemonSet Controller 將在能夠匹配上 [Node Affinity](https://kubernetes.io/docs/concepts/configuration/assign-pod-node/) 的 Node 上創建 Pod。
如果根本就沒有指定,則 DaemonSet Controller 將在所有 Node 上創建 Pod。
## 如何調度 Daemon Pod
正常情況下,Pod 運行在哪個機器上是由 Kubernetes 調度器進行選擇的。然而,由 Daemon Controller 創建的 Pod 已經確定了在哪個機器上(Pod 創建時指定了 `.spec.nodeName`),因此:
- DaemonSet Controller 并不關心一個 Node 的 [`unschedulable`](https://kubernetes.io/docs/admin/node/#manual-node-administration) 字段。
- DaemonSet Controller 可以創建 Pod,即使調度器還沒有被啟動,這對集群啟動是非常有幫助的。
Daemon Pod 關心 [Taint 和 Toleration](https://kubernetes.io/docs/concepts/configuration/assign-pod-node/#taints-and-tolerations-beta-feature),它們會為沒有指定 `tolerationSeconds` 的 `node.alpha.kubernetes.io/notReady` 和 `node.alpha.kubernetes.io/unreachable` 的 Taint,而創建具有 `NoExecute` 的 Toleration。這確保了當 alpha 特性的 `TaintBasedEvictions` 被啟用,當 Node 出現故障,比如網絡分區,這時它們將不會被清除掉(當 `TaintBasedEvictions` 特性沒有啟用,在這些場景下也不會被清除,但會因為 NodeController 的硬編碼行為而被清除,Toleration 是不會的)。
## 與 Daemon Pod 通信
與 DaemonSet 中的 Pod 進行通信,幾種可能的模式如下:
- **Push**:配置 DaemonSet 中的 Pod 向其它 Service 發送更新,例如統計數據庫。它們沒有客戶端。
- **NodeIP 和已知端口**:DaemonSet 中的 Pod 可以使用 `hostPort`,從而可以通過 Node IP 訪問到 Pod。客戶端能通過某種方法知道 Node IP 列表,并且基于此也可以知道端口。
- **DNS**:創建具有相同 Pod Selector 的 [Headless Service](https://kubernetes.io/docs/user-guide/services/#headless-services),然后通過使用 `endpoints` 資源或從 DNS 檢索到多個 A 記錄來發現 DaemonSet。
- **Service**:創建具有相同 Pod Selector 的 Service,并使用該 Service 訪問到某個隨機 Node 上的 daemon。(沒有辦法訪問到特定 Node)
## 更新 DaemonSet
如果修改了 Node Label,DaemonSet 將立刻向新匹配上的 Node 添加 Pod,同時刪除新近無法匹配上的 Node 上的 Pod。
可以修改 DaemonSet 創建的 Pod。然而,不允許對 Pod 的所有字段進行更新。當下次 Node(即使具有相同的名稱)被創建時,DaemonSet Controller 還會使用最初的模板。
可以刪除一個 DaemonSet。如果使用 `kubectl` 并指定 `--cascade=false` 選項,則 Pod 將被保留在 Node 上。然后可以創建具有不同模板的新 DaemonSet。具有不同模板的新 DaemonSet 將鞥能夠通過 Label 匹配識別所有已經存在的 Pod。它不會修改或刪除它們,即使是錯誤匹配了 Pod 模板。通過刪除 Pod 或者 刪除 Node,可以強制創建新的 Pod。
在 Kubernetes 1.6 或以后版本,可以在 DaemonSet 上 [執行滾動升級](https://kubernetes.io/docs/tasks/manage-daemon/update-daemon-set/)。
### init 腳本
很可能通過直接在一個 Node 上啟動 daemon 進程(例如,使用 `init`、`upstartd`、或 `systemd`)。這非常好,然而基于 DaemonSet 來運行這些進程有如下一些好處:
- 像對待應用程序一樣,具備為 daemon 提供監控和管理日志的能力。
- 為 daemon 和應用程序使用相同的配置語言和工具(如 Pod 模板、`kubectl`)。
- Kubernetes 未來版本可能會支持對 DaemonSet 創建 Pod 與 Node升級工作流進行集成。
- 在資源受限的容器中運行 daemon,能夠增加 daemon 和應用容器的隔離性。然而這也實現了在容器中運行 daemon,但卻不能在 Pod 中運行(例如,直接基于 Docker 啟動)。
### 裸 Pod
可能要直接創建 Pod,同時指定其運行在特定的 Node 上。
然而,DaemonSet 替換了由于任何原因被刪除或終止的 Pod,例如 Node 失敗、例行節點維護,比如內核升級。由于這個原因,我們應該使用 DaemonSet 而不是單獨創建 Pod。
### 靜態 Pod
很可能,通過在一個指定目錄下編寫文件來創建 Pod,該目錄受 Kubelet 所監視。這些 Pod 被稱為 [靜態 Pod](https://kubernetes.io/docs/concepts/cluster-administration/static-pod/)。
不像 DaemonSet,靜態 Pod 不受 kubectl 和 其它 Kubernetes API 客戶端管理。靜態 Pod 不依賴于 apiserver,這使得它們在集群啟動的情況下非常有用。
而且,未來靜態 Pod 可能會被廢棄掉。
### Replication Controller
DaemonSet 與 [Replication Controller](https://kubernetes.io/docs/user-guide/replication-controller) 非常類似,它們都能創建 Pod,這些 Pod 都具有不期望被終止的進程(例如,Web 服務器、存儲服務器)。
為無狀態的 Service 使用 Replication Controller,像 frontend,實現對副本的數量進行擴縮容、平滑升級,比之于精確控制 Pod 運行在某個主機上要重要得多。需要 Pod 副本總是運行在全部或特定主機上,并需要先于其他 Pod 啟動,當這被認為非常重要時,應該使用 Daemon Controller。
- 序言
- 云原生
- 云原生(Cloud Native)的定義
- CNCF - 云原生計算基金會簡介
- CNCF章程
- 云原生的設計哲學
- Play with Kubernetes
- 快速部署一個云原生本地實驗環境
- Kubernetes與云原生應用概覽
- 云原生應用之路——從Kubernetes到Cloud Native
- 云原生編程語言
- 云原生編程語言Ballerina
- 云原生編程語言Pulumi
- 云原生的未來
- Kubernetes架構
- 設計理念
- Etcd解析
- 開放接口
- CRI - Container Runtime Interface(容器運行時接口)
- CNI - Container Network Interface(容器網絡接口)
- CSI - Container Storage Interface(容器存儲接口)
- Kubernetes中的網絡
- Kubernetes中的網絡解析——以flannel為例
- Kubernetes中的網絡解析——以calico為例
- 具備API感知的網絡和安全性管理開源軟件Cilium
- Cilium架構設計與概念解析
- 資源對象與基本概念解析
- Pod狀態與生命周期管理
- Pod概覽
- Pod解析
- Init容器
- Pause容器
- Pod安全策略
- Pod的生命周期
- Pod Hook
- Pod Preset
- Pod中斷與PDB(Pod中斷預算)
- 集群資源管理
- Node
- Namespace
- Label
- Annotation
- Taint和Toleration(污點和容忍)
- 垃圾收集
- 控制器
- Deployment
- StatefulSet
- DaemonSet
- ReplicationController和ReplicaSet
- Job
- CronJob
- Horizontal Pod Autoscaling
- 自定義指標HPA
- 準入控制器(Admission Controller)
- 服務發現
- Service
- Ingress
- Traefik Ingress Controller
- 身份與權限控制
- ServiceAccount
- RBAC——基于角色的訪問控制
- NetworkPolicy
- 存儲
- Secret
- ConfigMap
- ConfigMap的熱更新
- Volume
- Persistent Volume(持久化卷)
- Storage Class
- 本地持久化存儲
- 集群擴展
- 使用自定義資源擴展API
- 使用CRD擴展Kubernetes API
- Aggregated API Server
- APIService
- Service Catalog
- 資源調度
- QoS(服務質量等級)
- 用戶指南
- 資源對象配置
- 配置Pod的liveness和readiness探針
- 配置Pod的Service Account
- Secret配置
- 管理namespace中的資源配額
- 命令使用
- Docker用戶過度到kubectl命令行指南
- kubectl命令概覽
- kubectl命令技巧大全
- 使用etcdctl訪問kubernetes數據
- 集群安全性管理
- 管理集群中的TLS
- kubelet的認證授權
- TLS bootstrap
- 創建用戶認證授權的kubeconfig文件
- IP偽裝代理
- 使用kubeconfig或token進行用戶身份認證
- Kubernetes中的用戶與身份認證授權
- Kubernetes集群安全性配置最佳實踐
- 訪問Kubernetes集群
- 訪問集群
- 使用kubeconfig文件配置跨集群認證
- 通過端口轉發訪問集群中的應用程序
- 使用service訪問群集中的應用程序
- 從外部訪問Kubernetes中的Pod
- Cabin - Kubernetes手機客戶端
- Kubernetic - Kubernetes桌面客戶端
- Kubernator - 更底層的Kubernetes UI
- 在Kubernetes中開發部署應用
- 適用于kubernetes的應用開發部署流程
- 遷移傳統應用到Kubernetes中——以Hadoop YARN為例
- 最佳實踐概覽
- 在CentOS上部署Kubernetes集群
- 創建TLS證書和秘鑰
- 創建kubeconfig文件
- 創建高可用etcd集群
- 安裝kubectl命令行工具
- 部署master節點
- 安裝flannel網絡插件
- 部署node節點
- 安裝kubedns插件
- 安裝dashboard插件
- 安裝heapster插件
- 安裝EFK插件
- 生產級的Kubernetes簡化管理工具kubeadm
- 使用kubeadm在Ubuntu Server 16.04上快速構建測試集群
- 服務發現與負載均衡
- 安裝Traefik ingress
- 分布式負載測試
- 網絡和集群性能測試
- 邊緣節點配置
- 安裝Nginx ingress
- 安裝配置DNS
- 安裝配置Kube-dns
- 安裝配置CoreDNS
- 運維管理
- Master節點高可用
- 服務滾動升級
- 應用日志收集
- 配置最佳實踐
- 集群及應用監控
- 數據持久化問題
- 管理容器的計算資源
- 集群聯邦
- 存儲管理
- GlusterFS
- 使用GlusterFS做持久化存儲
- 使用Heketi作為Kubernetes的持久存儲GlusterFS的external provisioner
- 在OpenShift中使用GlusterFS做持久化存儲
- GlusterD-2.0
- Ceph
- 用Helm托管安裝Ceph集群并提供后端存儲
- 使用Ceph做持久化存儲
- 使用rbd-provisioner提供rbd持久化存儲
- OpenEBS
- 使用OpenEBS做持久化存儲
- Rook
- NFS
- 利用NFS動態提供Kubernetes后端存儲卷
- 集群與應用監控
- Heapster
- 使用Heapster獲取集群和對象的metric數據
- Prometheus
- 使用Prometheus監控kubernetes集群
- Prometheus查詢語言PromQL使用說明
- 使用Vistio監控Istio服務網格中的流量
- 分布式跟蹤
- OpenTracing
- 服務編排管理
- 使用Helm管理Kubernetes應用
- 構建私有Chart倉庫
- 持續集成與發布
- 使用Jenkins進行持續集成與發布
- 使用Drone進行持續集成與發布
- 更新與升級
- 手動升級Kubernetes集群
- 升級dashboard
- 領域應用概覽
- 微服務架構
- 微服務中的服務發現
- 使用Java構建微服務并發布到Kubernetes平臺
- Spring Boot快速開始指南
- Service Mesh 服務網格
- 企業級服務網格架構
- Service Mesh基礎
- Service Mesh技術對比
- 采納和演進
- 定制和集成
- 總結
- Istio
- 安裝并試用Istio service mesh
- 配置請求的路由規則
- 安裝和拓展Istio service mesh
- 集成虛擬機
- Istio中sidecar的注入規范及示例
- 如何參與Istio社區及注意事項
- Istio教程
- Istio免費學習資源匯總
- 深入理解Istio Service Mesh中的Envoy Sidecar注入與流量劫持
- 深入理解Istio Service Mesh中的Envoy Sidecar代理的路由轉發
- Linkerd
- Linkerd 使用指南
- Conduit
- Condiut概覽
- 安裝Conduit
- Envoy
- Envoy的架構與基本術語
- Envoy作為前端代理
- Envoy mesh教程
- SOFAMesh
- SOFAMesh中的Dubbo on x-protocol
- SOFAMosn
- 使用 SOFAMosn 構建 SOFAMesh
- 大數據
- Spark standalone on Kubernetes
- 運行支持Kubernetes原生調度的Spark程序
- Serverless架構
- 理解Serverless
- FaaS-函數即服務
- OpenFaaS快速入門指南
- 邊緣計算
- 人工智能