Welcome to the Hadoop installed wiki!
以下是相關資料
[搭建hadoop-2.6.0-cdh5.4.7偽分布式](https://blog.liyang.io/108.html)
[apache hadoop-2.6.0-CDH5.4.1 安裝:完全分布式](http://blog.csdn.net/yew1eb/article/details/45790483)
[官網:Hadoop分布式文件系統:架構和設計](http://hadoop.apache.org/docs/r1.0.4/cn/hdfs_design.html)
[Yarn 和MapReduce比較](http://www.aboutyun.com/thread-7678-1-1.html)
[HBase 默認配置](http://blog.csdn.net/qq_20641565/article/details/54408279)
[基于CDH5.4.5(ha)的Hbase 3節點搭建](http://blog.csdn.net/qq_20641565/article/details/54410271)
[分布式系統概述(Hadoop與HBase的前生今世)](http://blog.csdn.net/pirateleo/article/details/8426736)
[HBase介紹、搭建、環境、安裝部署:架構、數據結構、原理](http://www.cnblogs.com/oraclestudy/articles/5665780.html)
[zk的作用及spark](http://blog.csdn.net/dream_an/article/details/52089883)
[HBase之單機模式與偽分布式模式安裝](http://blog.csdn.net/andie_guo/article/details/44086389)
HBase命令及數據結構//TODO
## HBase
- HMaster的作用:
為Region server分配region
負責Region server的負載均衡
發現失效的Region server并重新分配其上的region
HDFS上的垃圾文件回收
處理schema更新請求
- HRegionServer作用:
維護master分配給他的region,處理對這些region的io請求
負責切分正在運行過程中變的過大的region
可以看到,client訪問HBase上的數據并不需要master參與(尋址訪問zookeeper和region server,數據讀寫訪問region server),master僅僅維護table和region的元數據信息(table的元數據信息保存在zookeeper上),負載很低。
HRegionServer存取一個子表時,會創建一個HRegion對象,然后對表的每個列族創建一個Store實例,每個Store都會有一個MemStore和0個或多個StoreFile與之對應,每個StoreFile都會對應一個HFile, HFile就是實際的存儲文件。因此,一個HRegion有多少個列族就有多少個Store。
一個HRegionServer會有多個HRegion和一個HLog。
- 在看的書和文章
- Java程序員手冊
- 思維方式
- 面向服務
- Dubbo
- StringBoot
- 001.應用部署
- 002.注解學習
- SpringCloud
- SpringCloud入門
- Dbs
- 分布式
- Ffp
- 多線程
- 多線程小知識
- Java鎖認識
- Netty
- Netty學習目錄
- 讀寫事件流程分析與相關API
- 數據
- 大數據學習
- 學習目錄
- Hadoop學習
- Hadoop組建安裝
- ssh配置免密登陸
- Hadoop偽集群模式
- HBase偽集群模式
- Hive安裝
- 常用操作命令
- 問題記錄
- DOLIST
- 學習資料
- Spark
- 一些概念介紹
- 數據庫
- Oracle相關
- 批量測試數據生成
- MySQL相關
- Redis
- 常用操作
- 機器學習
- 認識
- Kafka
- 監控
- 分布式相關
- RPC
- 中間件
- ElasticSearch
- ES環境搭建
- Python客戶端創建索引
- Es的api常用操作
- SQL查詢引擎
- Es數DB的數據同步
- ActiveMQ
- ActiveMQ介紹
- 分享
- Skyeye
- 組件安裝配置
- Dubbo服務Demo應用部署
- Kafka安裝配置
- RabbitMq配置
- Docker
- Docker學習文章
- Docker的大數據平臺之路
- Docker環境搭建
- ubuntu16安裝docker
- Docker鏡像加速
- 使用Docker快速搭建中間件
- Docker環境使用mysql
- Docker環境的中間件搭建匯總
- Docker鏡像容器管理
- Docker鏡像創建
- Docker創建可用的系統容器
- Kubernetes
- etcd安裝
- flanneld安裝
- kubernetes環境安裝
- kubernetes源碼編譯
- Linux相關
- Linux操作系統
- Deepin操作系統
- 新系統環境準備
- Linux系統小工具
- Linxu配置時間服務器同步
- DNS服務器dnsmasq
- Linux命令
- 常用命令
- 計算機基礎
- README
- 數據結構
- 面試題總結
- 計算機組層原理
- 計算機組層原理
- 其它語言
- Python
- Python環境搭建
- Python學習總結
- Python語法學習
- Python模塊學習
- MySQLdb
- scrapy
- Python的exception
- PythonNLP入門
- Go
- 工具組件
- Jenkins
- Jenkins認識
- Jenkins安裝配置
- Jenkins插件使用
- Jenkins項目常用配置
- Git
- Git使用說明
- NLP
- 入門級別
- 一些概念
- faiss介紹
- WMD介紹