[怎樣進行大數據的入門級學習?](https://www.zhihu.com/question/24761255)
必須技能10條:
- 01.Java高級(虛擬機、并發)
- 02.Linux 基本操作
- 03.Hadoop(此處為俠義概念單指HDFS+MapReduce+Yarn )
- 04.HBase(JavaAPI操作+Phoenix )
- 05.Hive(Hql基本操作和原理理解)
- 06.Kafka
- 07.Storm
- 08.Scala需要
- 09.Python
- 10.Spark (Core+sparksql+Spark streaming )高階技能6條:
- 11.機器學習算法以及mahout庫加MLlib
- 12.R語言
- 13.Lambda 架構
- 14.Kappa架構
- 15.Kylin
- 16.Aluxio
二、學習路徑由于本人是從Java開發通過大概3個月的自學轉到大數據開發的。
所以我主要分享一下自己的學習路勁。
第一階段:
- 01.Linux學習(跟鳥哥學就ok了)
- 02.Java 高級學習(《深入理解Java虛擬機》、《Java高并發實戰》)
第二階段:
- 03.Hadoop (董西成的書)
- 04.HBase(《HBase權威指南》)
- 05.Hive(《Hive開發指南》)
- 06.Scala(《快學Scala》)
- 07.Spark (《Spark 快速大數據分析》)
- 08.Python (跟著廖雪峰的博客學習就ok了)
第三階段:對應技能需求,到網上多搜集一些資料就ok了,我把最重要的事情(要學什么告訴你了),
剩下的就是你去搜集對應的資料學習就ok了當然如果你覺得自己看書效率太慢,你可以網上搜集一些課程,
跟著課程走也OK 。這個完全根據自己情況決定。如果看書效率不高就很網課,相反的話就自己看書。
三,學習資源推薦:
- 01.Apache 官網
- 02.Stackoverflow
- 04.github
- 03.Cloudra官網
- 04.Databrick官網
- 05.過往的記憶(技術博客)
- 06.CSDN,51CTO
- 07.至于書籍當當一搜會有很多,其實內容都差不多。
最后但卻很重要一點:要多關注技術動向,持續學習。
- 在看的書和文章
- Java程序員手冊
- 思維方式
- 面向服務
- Dubbo
- StringBoot
- 001.應用部署
- 002.注解學習
- SpringCloud
- SpringCloud入門
- Dbs
- 分布式
- Ffp
- 多線程
- 多線程小知識
- Java鎖認識
- Netty
- Netty學習目錄
- 讀寫事件流程分析與相關API
- 數據
- 大數據學習
- 學習目錄
- Hadoop學習
- Hadoop組建安裝
- ssh配置免密登陸
- Hadoop偽集群模式
- HBase偽集群模式
- Hive安裝
- 常用操作命令
- 問題記錄
- DOLIST
- 學習資料
- Spark
- 一些概念介紹
- 數據庫
- Oracle相關
- 批量測試數據生成
- MySQL相關
- Redis
- 常用操作
- 機器學習
- 認識
- Kafka
- 監控
- 分布式相關
- RPC
- 中間件
- ElasticSearch
- ES環境搭建
- Python客戶端創建索引
- Es的api常用操作
- SQL查詢引擎
- Es數DB的數據同步
- ActiveMQ
- ActiveMQ介紹
- 分享
- Skyeye
- 組件安裝配置
- Dubbo服務Demo應用部署
- Kafka安裝配置
- RabbitMq配置
- Docker
- Docker學習文章
- Docker的大數據平臺之路
- Docker環境搭建
- ubuntu16安裝docker
- Docker鏡像加速
- 使用Docker快速搭建中間件
- Docker環境使用mysql
- Docker環境的中間件搭建匯總
- Docker鏡像容器管理
- Docker鏡像創建
- Docker創建可用的系統容器
- Kubernetes
- etcd安裝
- flanneld安裝
- kubernetes環境安裝
- kubernetes源碼編譯
- Linux相關
- Linux操作系統
- Deepin操作系統
- 新系統環境準備
- Linux系統小工具
- Linxu配置時間服務器同步
- DNS服務器dnsmasq
- Linux命令
- 常用命令
- 計算機基礎
- README
- 數據結構
- 面試題總結
- 計算機組層原理
- 計算機組層原理
- 其它語言
- Python
- Python環境搭建
- Python學習總結
- Python語法學習
- Python模塊學習
- MySQLdb
- scrapy
- Python的exception
- PythonNLP入門
- Go
- 工具組件
- Jenkins
- Jenkins認識
- Jenkins安裝配置
- Jenkins插件使用
- Jenkins項目常用配置
- Git
- Git使用說明
- NLP
- 入門級別
- 一些概念
- faiss介紹
- WMD介紹