# 遷移傳統應用到Kubernetes步驟詳解——以Hadoop YARN為例
本文檔不是說明如何在 kubernetes 中開發和部署應用程序,如果您想要直接開發應用程序在 kubernetes 中運行可以參考 [適用于kubernetes的應用開發部署流程](deploy-applications-in-kubernetes.md)。
本文旨在說明如何將已有的應用程序尤其是傳統的分布式應用程序遷移到 kubernetes 中。如果該類應用程序符合云原生應用規范(如12因素法則)的話,那么遷移會比較順利,否則會遇到一些麻煩甚至是阻礙。具體請參考 [遷移至云原生應用架構](https://github.com/rootsongjc/migrating-to-cloud-native-application-architectures)。
下圖是將單體應用遷移到云原生的步驟。

接下來我們將以 Spark on YARN with kubernetes 為例來說明,該例子足夠復雜也很有典型性,了解了這個例子可以幫助大家將自己的應用遷移到 kubernetes 集群上去,代碼和配置文件可以在 [這里](https://github.com/rootsongjc/kube-yarn) 找到(本文中加入 Spark 的配置,代碼中并沒有包含,讀者可以自己配置)。
下圖即整個架構的示意圖,代碼和詳細配置文件請參考 [kube-yarn](https://github.com/rootsongjc/kube-yarn)(不包含 ingress、spark 配置),所有的進程管理和容器擴容直接使用 Makefile。

**注意: 該例子僅用來說明具體的步驟劃分和復雜性,在生產環境應用還有待驗證,請謹慎使用。**
## 術語
對于為曾接觸過 kubernetes 或對云平臺的技術細節不太了解的人來說,如何將應用遷移到 kubernetes 中可能是個頭疼的問題,在行動之前有必要先了解整個過程中需要用到哪些概念和術語,有助于大家在行動中達成共識。
過程中可能用到的概念和術語初步整理如下:

為了講解整改過程和具體細節,我們所有操作都是通過命令手動完成,不使用自動化工具。當您充分了解到其中的細節后可以通過自動化工具來優化該過程,以使其更加自動和高效,同時減少因為人為操作失誤導致的遷移失敗。
## 遷移應用

整個遷移過程分為如下幾個步驟:
1. **將原有應用拆解為服務**
我們不是一上來就開始做鏡像,寫配置,而是應該先梳理下要遷移的應用中有哪些可以作為服務運行,哪些是變的,哪些是不變的部分。
服務劃分的原則是最小可變原則,這個同樣適用于鏡像制作,將服務中不變的部分編譯到同一個鏡像中。
對于像 Spark on YARN 這樣復雜的應用,可以將其劃分為三大類服務:
- ResourceManager
- NodeManager
- Spark client
2. **制作鏡像**
根據拆解出來的服務,我們需要制作兩個鏡像:
- Hadoop
- Spark (From hadoop docker image)
因為我們運行的是 Spark on YARN,因此 Spark 依賴與 Hadoop 鏡像,我們在 Spark 的基礎上包裝了一個 web service 作為服務啟動。
鏡像制作過程中不需要在 Dockerfile 中指定 Entrypoint 和 CMD,這些都是在 kubernetes 的 YAML 文件中指定的。
Hadoop YARN 的 Dockerfile 參考如下配置。
```docker
FROM my-docker-repo/jdk:7u80
# Add native libs
ARG HADOOP_VERSION=2.6.0-cdh5.5.2
## Prefer to download from server not use local storage
ADD hadoop-${HADOOP_VERSION}.tar.gz /usr/local
ADD ./lib/* /usr/local/hadoop-${HADOOP_VERSION}/lib/native/
ADD ./jars/* /usr/local/hadoop-${HADOOP_VERSION}/share/hadoop/yarn/
ENV HADOOP_PREFIX=/usr/local/hadoop \
HADOOP_COMMON_HOME=/usr/local/hadoop \
HADOOP_HDFS_HOME=/usr/local/hadoop \
HADOOP_MAPRED_HOME=/usr/local/hadoop \
HADOOP_YARN_HOME=/usr/local/hadoop \
HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop \
YARN_CONF_DIR=/usr/local/hadoop/etc/hadoop \
PATH=${PATH}:/usr/local/hadoop/bin
RUN \
cd /usr/local && ln -s ./hadoop-${HADOOP_VERSION} hadoop && \
rm -f ${HADOOP_PREFIX}/logs/*
WORKDIR $HADOOP_PREFIX
# Hdfs ports
EXPOSE 50010 50020 50070 50075 50090 8020 9000
# Mapred ports
EXPOSE 19888
#Yarn ports
EXPOSE 8030 8031 8032 8033 8040 8042 8088
#Other ports
EXPOSE 49707 2122
```
3. **準備應用的配置文件**
因為我們只制作了一個 Hadoop 的鏡像,而需要啟動兩個服務,這就要求在服務啟動的時候必須加載不同的配置文件,現在我們只需要準備兩個服務中需要同時用的的配置的部分。
YARN 依賴的配置在 `artifacts` 目錄下,包含以下文件:
```
bootstrap.sh
capacity-scheduler.xml
container-executor.cfg
core-site.xml
hadoop-env.sh
hdfs-site.xml
log4j.properties
mapred-site.xml
nodemanager_exclude.txt
slaves
start-yarn-nm.sh
start-yarn-rm.sh
yarn-env.sh
yarn-site.xml
```
其中作為 bootstrap 啟動腳本的 `bootstrap.sh` 也包含在該目錄下,該腳本的如何編寫請見下文。
4. **Kubernetes YAML 文件**
根據業務的特性選擇最適合的 kubernetes 的資源對象來運行,因為在 YARN 中 NodeManager 需要使用主機名向 ResourceManger 注冊,因此需要沿用 YARN 原有的服務發現方式,使用 headless service 和 StatefulSet 資源。更多資料請參考 [StatefulSet](../concepts/statefulset.md)。
所有的 Kubernetes YAML 配置文件存儲在 `manifest` 目錄下,包括如下配置:
- yarn-cluster 的 namespace 配置
- Spark、ResourceManager、NodeManager 的 headless service 和 StatefulSet 配置
- 需要暴露到 kubernetes 集群外部的 ingress 配置(ResourceManager 的 Web)
```
kube-yarn-ingress.yaml
spark-statefulset.yaml
yarn-cluster-namespace.yaml
yarn-nm-statefulset.yaml
yarn-rm-statefulset.yaml
```
5. **Bootstrap 腳本**
Bootstrap 腳本的作用是在啟動時根據 Pod 的環境變量、主機名或其他可以區分不同 Pod 和將啟動角色的變量來修改配置文件和啟動服務應用。
該腳本同時將原來 YARN 的日志使用 stdout 輸出,便于使用 `kubectl logs` 查看日志或其他日志收集工具進行日志收集。
啟動腳本 `bootstrap.sh` 跟 Hadoop 的配置文件同時保存在 `artifacts` 目錄下。
該腳本根據 Pod 的主機名,決定如何修改 Hadoop 的配置文件和啟動何種服務。`bootstrap.sh` 文件的部分代碼如下:
```bash
if [[ "${HOSTNAME}" =~ "yarn-nm" ]]; then
sed -i '/<\/configuration>/d' $HADOOP_PREFIX/etc/hadoop/yarn-site.xml
cat >> $HADOOP_PREFIX/etc/hadoop/yarn-site.xml <<- EOM
<property>
<name>yarn.nodemanager.resource.memory-mb</name>
<value>${MY_MEM_LIMIT:-2048}</value>
</property>
<property>
<name>yarn.nodemanager.resource.cpu-vcores</name>
<value>${MY_CPU_LIMIT:-2}</value>
</property>
EOM
echo '</configuration>' >> $HADOOP_PREFIX/etc/hadoop/yarn-site.xml
cp ${CONFIG_DIR}/start-yarn-nm.sh $HADOOP_PREFIX/sbin/
cd $HADOOP_PREFIX/sbin
chmod +x start-yarn-nm.sh
./start-yarn-nm.sh
fi
if [[ $1 == "-d" ]]; then
until find ${HADOOP_PREFIX}/logs -mmin -1 | egrep -q '.*'; echo "`date`: Waiting for logs..." ; do sleep 2 ; done
tail -F ${HADOOP_PREFIX}/logs/* &
while true; do sleep 1000; done
fi
```
從這部分中代碼中可以看到,如果 Pod 的主機名中包含 `yarn-nm` 字段則向 `yarn-site.xml` 配置文件中增加如下內容:
```xml
<property>
<name>yarn.nodemanager.resource.memory-mb</name>
<value>${MY_MEM_LIMIT:-2048}</value>
</property>
<property>
<name>yarn.nodemanager.resource.cpu-vcores</name>
<value>${MY_CPU_LIMIT:-2}</value>
</property>
```
其中 `MY_MEM_LIMIT` 和 `MY_CPU_LIMIT` 是 kubernetes YAML 中定義的環境變量,該環境變量又是引用的 Resource limit。
所有的配置準備完成后,執行 `start-yarn-nm.sh` 腳本啟動 NodeManager。
如果 kubernetes YAML 中的 container CMD args 中包含 `-d` 則在后臺運行 NodeManger 并 tail 輸出 NodeManager 的日志到標準輸出。
6. **ConfigMaps**
將 Hadoop 的配置文件和 bootstrap 腳本作為 ConfigMap 資源保存,用作 Pod 啟動時掛載的 volume。
```bash
kubectl create configmap hadoop-config \
--from-file=artifacts/hadoop/bootstrap.sh \
--from-file=artifacts/hadoop/start-yarn-rm.sh \
--from-file=artifacts/hadoop/start-yarn-nm.sh \
--from-file=artifacts/hadoop/slaves \
--from-file=artifacts/hadoop/core-site.xml \
--from-file=artifacts/hadoop/hdfs-site.xml \
--from-file=artifacts/hadoop/mapred-site.xml \
--from-file=artifacts/hadoop/yarn-site.xml \
--from-file=artifacts/hadoop/capacity-scheduler.xml \
--from-file=artifacts/hadoop/container-executor.cfg \
--from-file=artifacts/hadoop/hadoop-env.sh \
--from-file=artifacts/hadoop/log4j.properties \
--from-file=artifacts/hadoop/nodemanager_exclude.txt \
--from-file=artifacts/hadoop/yarn-env.sh
kubectl create configmap spark-config \
--from-file=artifacts/spark/spark-bootstrap.sh \
--from-file=artifacts/spark/spark-env.sh \
--from-file=artifacts/spark/spark-defaults.conf
```
所有的配置完成后,可以可以使用 kubectl 命令來啟動和管理集群了,我們編寫了 Makefile,您可以直接使用該 Makefile 封裝的命令實現部分的自動化。
- 序言
- 云原生
- 云原生(Cloud Native)的定義
- CNCF - 云原生計算基金會簡介
- CNCF章程
- 云原生的設計哲學
- Play with Kubernetes
- 快速部署一個云原生本地實驗環境
- Kubernetes與云原生應用概覽
- 云原生應用之路——從Kubernetes到Cloud Native
- 云原生編程語言
- 云原生編程語言Ballerina
- 云原生編程語言Pulumi
- 云原生的未來
- Kubernetes架構
- 設計理念
- Etcd解析
- 開放接口
- CRI - Container Runtime Interface(容器運行時接口)
- CNI - Container Network Interface(容器網絡接口)
- CSI - Container Storage Interface(容器存儲接口)
- Kubernetes中的網絡
- Kubernetes中的網絡解析——以flannel為例
- Kubernetes中的網絡解析——以calico為例
- 具備API感知的網絡和安全性管理開源軟件Cilium
- Cilium架構設計與概念解析
- 資源對象與基本概念解析
- Pod狀態與生命周期管理
- Pod概覽
- Pod解析
- Init容器
- Pause容器
- Pod安全策略
- Pod的生命周期
- Pod Hook
- Pod Preset
- Pod中斷與PDB(Pod中斷預算)
- 集群資源管理
- Node
- Namespace
- Label
- Annotation
- Taint和Toleration(污點和容忍)
- 垃圾收集
- 控制器
- Deployment
- StatefulSet
- DaemonSet
- ReplicationController和ReplicaSet
- Job
- CronJob
- Horizontal Pod Autoscaling
- 自定義指標HPA
- 準入控制器(Admission Controller)
- 服務發現
- Service
- Ingress
- Traefik Ingress Controller
- 身份與權限控制
- ServiceAccount
- RBAC——基于角色的訪問控制
- NetworkPolicy
- 存儲
- Secret
- ConfigMap
- ConfigMap的熱更新
- Volume
- Persistent Volume(持久化卷)
- Storage Class
- 本地持久化存儲
- 集群擴展
- 使用自定義資源擴展API
- 使用CRD擴展Kubernetes API
- Aggregated API Server
- APIService
- Service Catalog
- 資源調度
- QoS(服務質量等級)
- 用戶指南
- 資源對象配置
- 配置Pod的liveness和readiness探針
- 配置Pod的Service Account
- Secret配置
- 管理namespace中的資源配額
- 命令使用
- Docker用戶過度到kubectl命令行指南
- kubectl命令概覽
- kubectl命令技巧大全
- 使用etcdctl訪問kubernetes數據
- 集群安全性管理
- 管理集群中的TLS
- kubelet的認證授權
- TLS bootstrap
- 創建用戶認證授權的kubeconfig文件
- IP偽裝代理
- 使用kubeconfig或token進行用戶身份認證
- Kubernetes中的用戶與身份認證授權
- Kubernetes集群安全性配置最佳實踐
- 訪問Kubernetes集群
- 訪問集群
- 使用kubeconfig文件配置跨集群認證
- 通過端口轉發訪問集群中的應用程序
- 使用service訪問群集中的應用程序
- 從外部訪問Kubernetes中的Pod
- Cabin - Kubernetes手機客戶端
- Kubernetic - Kubernetes桌面客戶端
- Kubernator - 更底層的Kubernetes UI
- 在Kubernetes中開發部署應用
- 適用于kubernetes的應用開發部署流程
- 遷移傳統應用到Kubernetes中——以Hadoop YARN為例
- 最佳實踐概覽
- 在CentOS上部署Kubernetes集群
- 創建TLS證書和秘鑰
- 創建kubeconfig文件
- 創建高可用etcd集群
- 安裝kubectl命令行工具
- 部署master節點
- 安裝flannel網絡插件
- 部署node節點
- 安裝kubedns插件
- 安裝dashboard插件
- 安裝heapster插件
- 安裝EFK插件
- 生產級的Kubernetes簡化管理工具kubeadm
- 使用kubeadm在Ubuntu Server 16.04上快速構建測試集群
- 服務發現與負載均衡
- 安裝Traefik ingress
- 分布式負載測試
- 網絡和集群性能測試
- 邊緣節點配置
- 安裝Nginx ingress
- 安裝配置DNS
- 安裝配置Kube-dns
- 安裝配置CoreDNS
- 運維管理
- Master節點高可用
- 服務滾動升級
- 應用日志收集
- 配置最佳實踐
- 集群及應用監控
- 數據持久化問題
- 管理容器的計算資源
- 集群聯邦
- 存儲管理
- GlusterFS
- 使用GlusterFS做持久化存儲
- 使用Heketi作為Kubernetes的持久存儲GlusterFS的external provisioner
- 在OpenShift中使用GlusterFS做持久化存儲
- GlusterD-2.0
- Ceph
- 用Helm托管安裝Ceph集群并提供后端存儲
- 使用Ceph做持久化存儲
- 使用rbd-provisioner提供rbd持久化存儲
- OpenEBS
- 使用OpenEBS做持久化存儲
- Rook
- NFS
- 利用NFS動態提供Kubernetes后端存儲卷
- 集群與應用監控
- Heapster
- 使用Heapster獲取集群和對象的metric數據
- Prometheus
- 使用Prometheus監控kubernetes集群
- Prometheus查詢語言PromQL使用說明
- 使用Vistio監控Istio服務網格中的流量
- 分布式跟蹤
- OpenTracing
- 服務編排管理
- 使用Helm管理Kubernetes應用
- 構建私有Chart倉庫
- 持續集成與發布
- 使用Jenkins進行持續集成與發布
- 使用Drone進行持續集成與發布
- 更新與升級
- 手動升級Kubernetes集群
- 升級dashboard
- 領域應用概覽
- 微服務架構
- 微服務中的服務發現
- 使用Java構建微服務并發布到Kubernetes平臺
- Spring Boot快速開始指南
- Service Mesh 服務網格
- 企業級服務網格架構
- Service Mesh基礎
- Service Mesh技術對比
- 采納和演進
- 定制和集成
- 總結
- Istio
- 安裝并試用Istio service mesh
- 配置請求的路由規則
- 安裝和拓展Istio service mesh
- 集成虛擬機
- Istio中sidecar的注入規范及示例
- 如何參與Istio社區及注意事項
- Istio教程
- Istio免費學習資源匯總
- 深入理解Istio Service Mesh中的Envoy Sidecar注入與流量劫持
- 深入理解Istio Service Mesh中的Envoy Sidecar代理的路由轉發
- Linkerd
- Linkerd 使用指南
- Conduit
- Condiut概覽
- 安裝Conduit
- Envoy
- Envoy的架構與基本術語
- Envoy作為前端代理
- Envoy mesh教程
- SOFAMesh
- SOFAMesh中的Dubbo on x-protocol
- SOFAMosn
- 使用 SOFAMosn 構建 SOFAMesh
- 大數據
- Spark standalone on Kubernetes
- 運行支持Kubernetes原生調度的Spark程序
- Serverless架構
- 理解Serverless
- FaaS-函數即服務
- OpenFaaS快速入門指南
- 邊緣計算
- 人工智能