[TOC]
* * * * *
### 1. FastDFS介紹
FastDFS( Fast Distributed file system)是一款輕量級的、高性能的、阿里巴巴開源的分布式文件系統。該系統的作者是余慶 (happyfish100),github地址:https://github.com/happyfish100 ,使用Fastdfs可以解決大規模數據存儲和負載均衡問題。該文件系統主要提供了一下功能:
* 文件存儲
* 文件同步
* 文件訪問(文件上傳、下載和刪除等功能)
fastdfs的設計充分考慮到了冗余備份、負載均衡、線性擴容等機制,并注重高可用、高性能等指標,使用FastDFS很容易搭建一套高性能的文件服務器集群提供文件上傳、下載等服務。適合于在線的圖片和視頻分享的網站。
以其出色的表現,FastDFS已經在許多互聯網公司得到了應用,其中包括京東、阿里巴巴、Lockbur等。
### 2. FastDFS架構
FastDFS文件系統結構示意圖:

### 2.1 系統服務角色
如上圖,文件系統主要分為Tracker(跟蹤器)和Storage(存儲節點)兩種角色,且兩種節點都支持單節點和多節點部署。tracker和storage中的多個節點是對等關系并無沒有主從之分,所以不存在大部分分布式系統中的單點問題。
1. tracker(跟蹤器節點)
1)控制文件訪問任務的調度和訪問的負載均衡。系統運行時記錄中所有存儲組和存儲服務器的狀態信息, 是客戶端和數據服務器交互的紐帶。
2)tracker可以是單點和集群模式-多個tracker節點。系統運行時可以隨時添加和移出tracker節點,不會影響線上服務。
2. storage(存儲節點)
1)storage提供對文件的管理,包括文件存儲、文件同步和文件訪問功能,同時也提供對文件元數據(文件的屬性的鍵值對列表)的管理,例如width=1024, 鍵是"width",值為 "1024".
2)定時主動向Tracker server報告其狀態信息,包括磁盤剩余空間、文件同步狀況、文件上傳下載次數等統計信息
3)Storage支持集群模式,集群由多個group組成,而一個group由一個或者多個storage組成,這些storage具體體現為具有相同的group_name。
storage server具有以下七種狀態:
~~~
FDFS_STORAGE_STATUS_INIT :初始化,尚未得到同步已有數據的源服務器
FDFS_STORAGE_STATUS_WAIT_SYNC :等待同步,已得到同步已有數據的源服務器
FDFS_STORAGE_STATUS_SYNCING :同步中
FDFS_STORAGE_STATUS_DELETED :已刪除,該服務器從本組中摘除(注:本狀態的功能尚未實現)
FDFS_STORAGE_STATUS_OFFLINE :離線
FDFS_STORAGE_STATUS_ONLINE :在線,尚不能提供服務
FDFS_STORAGE_STATUS_ACTIVE :在線,可以提供服務
~~~
### 2.2 數據存儲
#### 2.2.1 存儲架構
1. 文件的存儲服務是由Storage server提供。
2. Storage集群由多個volume(卷)或稱group(組)構成,volume/group之間的文件是獨立的,整個系統的存儲能力由這些volume/group的存儲能力的總合決定。
3. 一個volume/group可以包含一個或者多個storage節點,這些storage節點之間的數據是相同的,起到容災備份和負載均衡等功能。當向volume/group中添加storage server,volume中的文件會被自動地復制到這個新storage server當中,當數據復制完成后,系統會把該storage server轉換為上線狀態提供文件服務。
4. 當整個系統存儲容量不足時,可以添加volume來擴容,文件的標識有volume名稱和文件名確定。
#### 2.2.1 數據交互
配合架構圖,更好理解交互過程。
1. 客戶端上傳文件
1. client詢問tracker可以把文件上傳哪個storage,不需要附加參數;
2. tracker通過負載均衡策略返回一臺可用的storage信息(ip、port);
3. client利用tracker返回的信息與storage建立完成文件上傳。
2. 客戶端下載文件
1. client詢問tracker到哪個storage上去下載文件,參數為文件標識(卷名和文件名);
2. tracker通過負載均衡策略返回一臺可用的storage信息(ip、port);
3. client利用tracker返回的信息與storage建立連接,完成文件下載。
### 3. 同步機制
#### 3.1 storage server信息同步
1. storage server信息存在于tracker server和storage之中,且兩者之間的信息時相互同步的。
2. tracker運行時會把storage server信息放在內存中,并且會把數據持久化到磁盤文件中,以免重啟后數據丟失。
3. storage會記錄本組所有的storage server信息,并且也會進行持久化。
##### 3.1.1 何時發生storage信息同步?
當新增storage server實例或者系統中的storage server狀態發生變化時:
1. storage server主動連接tracker server
2. tracker server發現有新的storage server連接,將所在組的所有storage返回給新的storage,然后將最新的所有列表同步給組內其他storage。
當新增tracker時:
1. storage server連接該tracker server,發現該tracker server返回的本組storage server列表比本機記錄的要少,就會將該tracker server上沒有的storage server同步給該tracker server。
#### 3.2 數據同步
1. 當上傳新文件時
前邊講到,客戶端上傳文件時首先會和tracker server通信,獲得一個可用的storage server信息,接著與這臺storage server進行文件上傳(此時稱這臺服務器為源服務器),這時源服務器會將數據以push的方式同步給組內其他storage server(目標服務器)。數據同步按照以下規則:
1)數據同步是發生在同一組內的所有storage server之間
2)源頭數據(client端最開始上傳到系統的文件)需要同步,其他數據不需要,以免發生環路
2. 當有新storage加入時
由組中某一storage server將其所有的數據,同步給新storage。待同步完成后,系統將新storage server的轉態轉換為在線,此時該storage server可以提供服務。
因為文件同步采用的是異步的方式,所以可能會出現剛剛上傳的文件client訪問不到的問題
- Docker
- 什么是docker
- Docker安裝、組件啟動
- docker網絡
- docker命令
- docker swarm
- dockerfile
- mesos
- 運維
- Linux
- Linux基礎
- Linux常用命令_1
- Linux常用命令_2
- ip命令
- 什么是Linux
- SELinux
- Linux GCC編譯警告:Clock skew detected. 錯誤解決辦法
- 文件描述符
- find
- 資源統計
- LVM
- Linux相關配置
- 服務自啟動
- 服務器安全
- 字符集
- shell腳本
- shell命令
- 實用腳本
- shell 數組
- 循環與判斷
- 系統級別進程開啟和停止
- 函數
- java調用shell腳本
- 發送郵件
- Linux網絡配置
- Ubuntu
- Ubuntu發送郵件
- 更換apt-get源
- centos
- 防火墻
- 虛擬機下配置網絡
- yum重新安裝
- 安裝mysql5.7
- 配置本地yum源
- 安裝telnet
- 忘記root密碼
- rsync+ crontab
- Zabbix
- Zabbix監控
- Zabbix安裝
- 自動報警
- 自動發現主機
- 監控MySQL
- 安裝PHP常見錯誤
- 基于nginx安裝zabbix
- 監控Tomcat
- 監控redis
- web監控
- 監控進程和端口號
- zabbix自定義監控
- 觸發器函數
- zabbix監控mysql主從同步狀態
- Jenkins
- 安裝Jenkins
- jenkins+svn+maven
- jenkins執行shell腳本
- 參數化構建
- maven區分環境打包
- jenkins使用注意事項
- nginx
- nginx認證功能
- ubuntu下編譯安裝Nginx
- 編譯安裝
- Nginx搭建本地yum源
- 文件共享
- Haproxy
- 初識Haproxy
- haproxy安裝
- haproxy配置
- virtualbox
- virtualbox 復制新的虛擬機
- ubuntu下vitrualbox安裝redhat
- centos配置雙網卡
- 配置存儲
- Windows
- Windows安裝curl
- VMware vSphere
- 磁盤管理
- 增加磁盤
- gitlab
- 安裝
- tomcat
- Squid
- bigdata
- FastDFS
- FastFDS基礎
- FastFDS安裝及簡單實用
- api介紹
- 數據存儲
- FastDFS防盜鏈
- python腳本
- ELK
- logstash
- 安裝使用
- kibana
- 安準配置
- elasticsearch
- elasticsearch基礎_1
- elasticsearch基礎_2
- 安裝
- 操作
- java api
- 中文分詞器
- term vector
- 并發控制
- 對text字段排序
- 倒排和正排索引
- 自定義分詞器
- 自定義dynamic策略
- 進階練習
- 共享鎖和排它鎖
- nested object
- 父子關系模型
- 高亮
- 搜索提示
- Redis
- redis部署
- redis基礎
- redis運維
- redis-cluster的使用
- redis哨兵
- redis腳本備份還原
- rabbitMQ
- rabbitMQ安裝使用
- rpc
- RocketMQ
- 架構概念
- 安裝
- 實例
- 好文引用
- 知乎
- ACK
- postgresql
- 存儲過程
- 編程語言
- 計算機網絡
- 基礎_01
- tcp/ip
- http轉https
- Let's Encrypt免費ssl證書(基于haproxy負載)
- what's the http?
- 網關
- 網絡IO
- http
- 無狀態網絡協議
- Python
- python基礎
- 基礎數據類型
- String
- List
- 遍歷
- Python基礎_01
- python基礎_02
- python基礎03
- python基礎_04
- python基礎_05
- 函數
- 網絡編程
- 系統編程
- 類
- Python正則表達式
- pymysql
- java調用python腳本
- python操作fastdfs
- 模塊導入和sys.path
- 編碼
- 安裝pip
- python進階
- python之setup.py構建工具
- 模塊動態導入
- 內置函數
- 內置變量
- path
- python模塊
- 內置模塊_01
- 內置模塊_02
- log模塊
- collections
- Twisted
- Twisted基礎
- 異步編程初探與reactor模式
- yield-inlineCallbacks
- 系統編程
- 爬蟲
- urllib
- xpath
- scrapy
- 爬蟲基礎
- 爬蟲種類
- 入門基礎
- Rules
- 反反爬蟲策略
- 模擬登陸
- problem
- 分布式爬蟲
- 快代理整站爬取
- 與es整合
- 爬取APP數據
- 爬蟲部署
- collection for ban of web
- crawlstyle
- API
- 多次請求
- 向調度器發送請求
- 源碼學習
- LinkExtractor源碼分析
- 構建工具-setup.py
- selenium
- 基礎01
- 與scrapy整合
- Django
- Django開發入門
- Django與MySQL
- java
- 設計模式
- 單例模式
- 工廠模式
- java基礎
- java位移
- java反射
- base64
- java內部類
- java高級
- 多線程
- springmvc-restful
- pfx數字證書
- 生成二維碼
- 項目中使用log4j
- 自定義注解
- java發送post請求
- Date時間操作
- spring
- 基礎
- spring事務控制
- springMVC
- 注解
- 參數綁定
- springmvc+spring+mybatis+dubbo
- MVC模型
- SpringBoot
- java配置入門
- SpringBoot基礎入門
- SpringBoot web
- 整合
- SpringBoot注解
- shiro權限控制
- CommandLineRunner
- mybatis
- 靜態資源
- SSM整合
- Aware
- Spring API使用
- Aware接口
- mybatis
- 入門
- mybatis屬性自動映射、掃描
- 問題
- @Param 注解在Mybatis中的使用 以及傳遞參數的三種方式
- mybatis-SQL
- 逆向生成dao、model層代碼
- 反向工程中Example的使用
- 自增id回顯
- SqlSessionDaoSupport
- invalid bound statement(not found)
- 脈絡
- beetl
- beetl是什么
- 與SpringBoot整合
- shiro
- 什么是shiro
- springboot+shrio+mybatis
- 攔截url
- 枚舉
- 圖片操作
- restful
- java項目中日志處理
- JSON
- 文件工具類
- KeyTool生成證書
- 兼容性問題
- 開發規范
- 工具類開發規范
- 壓縮圖片
- 異常處理
- web
- JavaScript
- 基礎語法
- 創建對象
- BOM
- window對象
- DOM
- 閉包
- form提交-文件上傳
- td中內容過長
- 問題1
- js高級
- js文件操作
- 函數_01
- session
- jQuery
- 函數01
- data()
- siblings
- index()與eq()
- select2
- 動態樣式
- bootstrap
- 表單驗證
- 表格
- MUI
- HTML
- iframe
- label標簽
- 規范編程
- layer
- sss
- 微信小程序
- 基礎知識
- 實踐
- 自定義組件
- 修改自定義組件的樣式
- 基礎概念
- appid
- 跳轉
- 小程序發送ajax
- 微信小程序上下拉刷新
- if
- 工具
- idea
- Git
- maven
- svn
- Netty
- 基礎概念
- Handler
- SimpleChannelInboundHandler 與 ChannelInboundHandler
- 網絡編程
- 網絡I/O
- database
- oracle
- 游標
- PLSQL Developer
- mysql
- MySQL基準測試
- mysql備份
- mysql主從不同步
- mysql安裝
- mysql函數大全
- SQL語句
- 修改配置
- 關鍵字
- 主從搭建
- centos下用rpm包安裝mysql
- 常用sql
- information_scheme數據庫
- 值得學的博客
- mysql學習
- 運維
- mysql權限
- 配置信息
- 好文mark
- jsp
- jsp EL表達式
- C
- test