云原生應用之路——從Kubernetes到Cloud Native · kubernetes完整攻略

# 云原生應用之路——從Kubernetes到Cloud Native **從Kubernetes到Cloud Native——云原生應用之路**，這是我最近在 [ArchSummit2017北京站](http://bj2017.archsummit.com/presentation/306) 和 [數人云&TalkingData合辦的Service Mesh is coming meetup](https://www.kubernetes.org.cn/3211.html) 中分享的話題。本文簡要介紹了容器技術發展的路徑，為何Kubernetes的出現是容器技術發展到這一步的必然選擇，而為何Kubernetes又將成為云原生應用的基石。我的分享按照這樣的主線展開：容器->Kubernetes->微服務->Cloud Native（云原生）->Service Mesh（服務網格）->使用場景->Open Source（開源）。 ## 容器 > 容器——Cloud Native的基石容器最初是通過開發者工具而流行，可以使用它來做隔離的開發測試環境和持續集成環境，這些都是因為容器輕量級，易于配置和使用帶來的優勢，docker和docker-compose這樣的工具極大的方便的了應用開發環境的搭建，開發者就像是化學家一樣在其中小心翼翼的進行各種調試和開發。隨著容器的在開發者中的普及，已經大家對CI流程的熟悉，容器周邊的各種工具蓬勃發展，儼然形成了一個小生態，在2016年達到頂峰，下面這張是我畫的容器生態圖： ![容器生態圖 Container ecosystem](https://box.kancloud.cn/cd3beb3efdd9ffbc4bba1f518eee3a3b_3142x4506.png) 該生態涵蓋了容器應用中從鏡像倉庫、服務編排、安全管理、持續集成與發布、存儲和網絡管理等各個方面，隨著在單主機中運行容器的成熟，集群管理和容器編排成為容器技術亟待解決的問題。譬如化學家在實驗室中研究出來的新產品，如何推向市場，進行大規模生產，成了新的議題。 ## 為什么使用Kubernetes > Kubernetes——讓容器應用進入大規模工業生產。 **Kubernetes是容器編排系統的事實標準** 在單機上運行容器，無法發揮它的最大效能，只有形成集群，才能最大程度發揮容器的良好隔離、資源分配與編排管理的優勢，而對于容器的編排管理，Swarm、Mesos和Kubernetes的大戰已經基本宣告結束，Kubernetes成為了無可爭議的贏家。下面這張圖是Kubernetes的架構圖（圖片來自網絡），其中顯示了組件之間交互的接口CNI、CRI、OCI等，這些將Kubernetes與某款具體產品解耦，給用戶最大的定制程度，使得Kubernetes有機會成為跨云的真正的云原生應用的操作系統。 ![Kubernetes架構](https://box.kancloud.cn/389a1d00d29b41567772fe46e646502a_1858x1126.jpg) 隨著Kubernetes的日趨成熟，“Kubernetes is becoming boring”，基于該“操作系統”之上構建的適用于不同場景的應用將成為新的發展方向，就像我們將石油開采出來后，提煉出汽油、柴油、瀝青等等，所有的材料都將找到自己的用途，Kubernetes也是，畢竟我們誰也不是為了部署和管理容器而用Kubernetes，承載其上的應用才是價值之所在。 **云原生的核心目標** ![Cloud Native Core target](https://box.kancloud.cn/a745c7b1ad6b843c091c82bf9e048f49_975x787.jpg) 云已經可以為我們提供穩定可以唾手可得的基礎設施，但是業務上云成了一個難題，Kubernetes的出現與其說是從最初的容器編排解決方案，倒不如說是為了解決應用上云（即云原生應用）這個難題。包括微服務和FaaS/Serverless架構，都可以作為云原生應用的架構。 ![FaaS Landscape](https://box.kancloud.cn/809818ee633379084d148cc4586e8668_1280x720.jpg) 但就2017年為止，Kubernetes的主要使用場景也主要作為應用開發測試環境、CI/CD和運行Web應用這幾個領域，如下圖[TheNewStack](http://thenewstack.io)的Kubernetes生態狀況調查報告所示。 ![Workloads running on Kubernetes](https://ws3.sinaimg.cn/large/0069RVTdgy1fv5mxr6fxtj31kw11q484.jpg) 另外基于Kubernetes的構建PaaS平臺和Serverless也處于爆發的準備的階段，如下圖中Gartner的報告中所示： ![Gartner技術爆發趨勢圖2017](https://ws4.sinaimg.cn/large/0069RVTdgy1fv5my2jtxzj315o0z8dkr.jpg) 當前各大公有云如Google GKE、微軟Azure ACS、亞馬遜EKS（2018年上線）、VMWare、Pivotal、騰訊云、阿里云等都提供了Kubernetes服務。 ## 微服務 > 微服務——Cloud Native的應用架構。下圖是[Bilgin Ibryam](https://developers.redhat.com/blog/author/bibryam/)給出的微服務中應該關心的主題，圖片來自[RedHat Developers](https://developers.redhat.com/blog/2016/12/09/spring-cloud-for-microservices-compared-to-kubernetes/)。 ![Microservices concerns](https://box.kancloud.cn/f475a1833f035f9e942db4848baac1ed_1678x1614.jpg) 微服務帶給我們很多開發和部署上的靈活性和技術多樣性，但是也增加了服務調用的開銷、分布式系統管理、調試與服務治理方面的難題。當前最成熟最完整的微服務框架可以說非[Spring](https://spring.io/)莫屬，而Spring又僅限于Java語言開發，其架構本身又跟Kubernetes存在很多重合的部分，如何探索將Kubernetes作為微服務架構平臺就成為一個熱點話題。就拿微服務中最基礎的**服務注冊發現**功能來說，其方式分為**客戶端服務發現**和**服務端服務發現**兩種，Java應用中常用的方式是使用Eureka和Ribbon做服務注冊發現和負載均衡，這屬于客戶端服務發現，而在Kubernetes中則可以使用DNS、Service和Ingress來實現，不需要修改應用代碼，直接從網絡層面來實現。 ![兩種服務發現方式](https://box.kancloud.cn/ba693270c4fb506f8e01c2aeee8daabd_1084x652.png) ## Cloud Native > DevOps——通向云原生的云梯 CNCF（云原生計算基金會）給出了云原生應用的三大特征： - **容器化包裝**：軟件應用的進程應該包裝在容器中獨立運行。 - **動態管理**：通過集中式的編排調度系統來動態的管理和調度。 - **微服務化**：明確服務間的依賴，互相解耦。下圖是我整理的關于云原生所需要的能力和特征。 ![Cloud Native Features](https://jimmysong.io/kubernetes-handbook/images/cloud-native-architecutre-mindnode.jpg) [CNCF](https://cncf.io)所托管的應用（目前已達12個），即朝著這個目標發展，其公布的[Cloud Native Landscape](https://github.com/cncf/landscape)，給出了云原生生態的參考體系。 ![Cloud Native Landscape v1.0](https://ws3.sinaimg.cn/large/0069RVTdgy1fv5myp6ednj31kw0w0u0x.jpg) **使用Kubernetes構建云原生應用** 我們都是知道Heroku推出了適用于PaaS的[12 factor app](https://12factor.net/)的規范，包括如下要素： 1. 基準代碼 2. 依賴管理 3. 配置 4. 后端服務 5. 構建，發布，運行 6. 無狀態進程 7. 端口綁定 8. 并發 9. 易處理 10. 開發環境與線上環境等價 11. 日志作為事件流 12. 管理進程另外還有補充的三點： - API聲明管理 - 認證和授權 - 監控與告警如果落實的具體的工具，請看下圖，使用Kubernetes構建云原生架構： ![Building a Cloud Native Architecture with Kubernetes followed 12 factor app](https://box.kancloud.cn/30d478bdd30c6bf2e2eb7dcbd5250330_2208x1388.png) 結合這12因素對開發或者改造后的應用適合部署到Kubernetes之上，基本流程如下圖所示： ![Creating Kubernetes native app](https://box.kancloud.cn/ec2240a5c4c86c992db79dcea4f93775_2642x1590.jpg) **遷移到云架構** 遷移到云端架構，相對單體架構來說會帶來很多挑戰。比如自動的持續集成與發布、服務監控的變革、服務暴露、權限的管控等。這些具體細節請參考**Kubernetes-handbook**中的說明：<https://jimmysong.io/kubernetes-handbook>，在此就不細節展開，另外推薦一本我翻譯的由Pivotal出品的電子書——[Migrating to Cloud Native Application Architectures](https://content.pivotal.io/ebooks/migrating-to-cloud-native-application-architectures)，地址：<https://jimmysong.io/migrating-to-cloud-native-application-architectures/>。 ## Service Mesh > Services for show, meshes for a pro. Kubernetes中的應用將作為微服務運行，但是Kubernetes本身并沒有給出微服務治理的解決方案，比如服務的限流、熔斷、良好的灰度發布支持等。 **Service Mesh可以用來做什么** - Traffic Management：API網關 - Observability：服務調用和性能分析 - Policy Enforcment：控制服務訪問策略 - Service Identity and Security：安全保護 **Service Mesh的特點** - 專用的基礎設施層 - 輕量級高性能網絡代理 - 提供安全的、快速的、可靠地服務間通訊 - 擴展kubernetes的應用負載均衡機制，實現灰度發布 - 完全解耦于應用，應用可以無感知，加速應用的微服務和云原生轉型使用Service Mesh將可以有效的治理Kubernetes中運行的服務，當前開源的Service Mesh有： - Linkderd：<https://linkerd.io>，由最早提出Service Mesh的公司[Buoyant](https://buoyant.io)開源，創始人來自Twitter - Envoy：<https://www.envoyproxy.io/>，Lyft開源的，可以在Istio中使用Sidecar模式運行 - Istio：<https://istio.io>，由Google、IBM、Lyft聯合開發并開源 - Conduit：<https://conduit.io>，同樣由Buoyant開源的輕量級的基于Kubernetes的Service Mesh 此外還有很多其它的Service Mesh魚貫而出，請參考[awesome-cloud-native](https://jimmysong.io/awesome-cloud-native)。 **Istio VS Linkerd** Linkerd和Istio是最早開源的Service Mesh，它們都支持Kubernetes，下面是它們之間的一些特性對比。 | **Feature** | **Istio** | **Linkerd** | | ----------- | ------------- | ---------------------------- | | 部署架構 | Envoy/Sidecar | DaemonSets | | 易用性 | 復雜 | 簡單 | | 支持平臺 | Kubernetes | Kubernetes/Mesos/Istio/Local | | 當前版本 | 0.8 | 1.4.3 | | 是否已有生產部署 | 否 | 是 | 關于兩者的架構可以參考各自的官方文檔，我只從其在Kubernetes上的部署結構來說明其區別。 ![istio vs linkerd](https://box.kancloud.cn/dbad49c6d98acd8cf10fc247a98ffa49_507x652.jpg) Istio的組件復雜，可以分別部署在Kubernetes集群中，但是作為核心路由組件**Envoy**是以**Sidecar**形式與應用運行在同一個Pod中的，所有進入該Pod中的流量都需要先經過Envoy。 Linker的部署十分簡單，本身就是一個鏡像，使用Kubernetes的[DaemonSet](https://jimmysong.io/kubernetes-handbook/concepts/daemonset.html)方式在每個node節點上運行。更多信息請參考[kubernetes-handbook](https://jimmysong.io/kubernetes-handbook)。 ## 使用場景 > Cloud Native的大規模工業生產 **GitOps** 給開發者帶來最大的配置和上線的靈活性，踐行DevOps流程，改善研發效率，下圖這樣的情況將更少發生。 ![Deployment pipeline](https://ws4.sinaimg.cn/large/0069RVTdgy1fv5mzj8rj6j318g1ewtfc.jpg) 我們知道Kubernetes中的所有應用的部署都是基于YAML文件的，這實際上就是一種**Infrastructure as code**，完全可以通過Git來管控基礎設施和部署環境的變更。 **Big Data** Spark現在已經非官方支持了基于Kubernetes的原生調度，其具有以下特點： - Kubernetes原生調度：與yarn、mesos同級 - 資源隔離，粒度更細：以namespace來劃分用戶 - 監控的變革：單次任務資源計量 - 日志的變革：pod的日志收集 | **Feature** | **Yarn** | **Kubernetes** | | ------------- | ---------------- | -------------- | | queue | queue | namespace | | instance | ExcutorContainer | Executor Pod | | network | host | plugin | | heterogeneous | no | yes | | security | RBAC | ACL | 下圖是在Kubernetes上運行三種調度方式的spark的單個節點的應用部分對比： ![Spark on Kubernetes with different schedulers](https://box.kancloud.cn/ed54ab21119e361f2eab51e412d07477_918x489.jpg) 從上圖中可以看到在Kubernetes上使用YARN調度、standalone調度和Kubernetes原生調度的方式，每個node節點上的Pod內的Spark Executor分布，毫無疑問，使用Kubernetes原生調度的Spark任務才是最節省資源的。提交任務的語句看起來會像是這樣的： ```bash ./spark-submit \ --deploy-mode cluster \ --class com.talkingdata.alluxio.hadooptest \ --master k8s://https://172.20.0.113:6443 \ --kubernetes-namespace spark-cluster \ --conf spark.kubernetes.driverEnv.SPARK_USER=hadoop \ --conf spark.kubernetes.driverEnv.HADOOP_USER_NAME=hadoop \ --conf spark.executorEnv.HADOOP_USER_NAME=hadoop \ --conf spark.executorEnv.SPARK_USER=hadoop \ --conf spark.kubernetes.authenticate.driver.serviceAccountName=spark \ --conf spark.driver.memory=100G \ --conf spark.executor.memory=10G \ --conf spark.driver.cores=30 \ --conf spark.executor.cores=2 \ --conf spark.driver.maxResultSize=10240m \ --conf spark.kubernetes.driver.limit.cores=32 \ --conf spark.kubernetes.executor.limit.cores=3 \ --conf spark.kubernetes.executor.memoryOverhead=2g \ --conf spark.executor.instances=5 \ --conf spark.app.name=spark-pi \ --conf spark.kubernetes.driver.docker.image=spark-driver:v2.1.0-kubernetes-0.3.1-1 \ --conf spark.kubernetes.executor.docker.image=spark-executor:v2.1.0-kubernetes-0.3.1-1 \ --conf spark.kubernetes.initcontainer.docker.image=spark-init:v2.1.0-kubernetes-0.3.1-1 \ --conf spark.kubernetes.resourceStagingServer.uri=http://172.20.0.114:31000 \ ~/Downloads/tendcloud_2.10-1.0.jar ``` 關于支持Kubernetes原生調度的Spark請參考：https://jimmysong.io/spark-on-k8s/ ## Open Source > Contributing is Not only about code, it is about helping a community. 下圖是我們剛調研準備使用Kubernetes時候的調研方案選擇。 ![Kubernetes solutions](https://ws3.sinaimg.cn/large/0069RVTdgy1fv5mzywc83j31fk1i8qg4.jpg) 對于一個初次接觸Kubernetes的人來說，看到這樣一個龐大的架構選型時會望而生畏，但是Kubernetes的開源社區幫助了我們很多。 ![Kubernetes SIG](https://box.kancloud.cn/40e1ac7bc507423d3baa7f6a335d0521_2146x1868.jpg) 我組建了**K8S&Cloud Native實戰**、**ServiceMesher**微信群，參與了k8smeetup、KEUC2017、[kubernetes-docs-cn](https://github.com/kubernetes/kubernetes-docs-cn) Kubernetes官方中文文檔項目。 **有用的資料和鏈接** - 我的博客： <https://jimmysong.io> - 微信群：k8s&cloud native實戰群、ServiceMesher（見：<https://jimmysong.io/about>） - Meetup：k8smeetup、[ServiceMesher](http://www.servicemesher.com) - Cloud Native Go - 基于Go和React云原生Web應用開發：https://jimmysong.io/cloud-native-go - Gitbook：<https://jimmysong.io/kubernetes-handbook> - Cloud native開源生態：<https://jimmysong.io/awesome-cloud-native/> - 資料分享整理：<https://github.com/rootsongjc/cloud-native-slides-share> - 遷移到云原生架構：<https://jimmysong.io/migrating-to-cloud-native-application-architectures/> - KubeCon + CloudNativeCon 2018年11月14-15日上海