
## 一、簡介
Apache Flume 是一個分布式,高可用的數據收集系統,可以從不同的數據源收集數據,經過聚合后發送到分布式計算框架或者存儲系統中。Spark Straming 提供了以下兩種方式用于 Flume 的整合。
## 二、推送式方法
在推送式方法 (Flume-style Push-based Approach) 中,Spark Streaming 程序需要對某臺服務器的某個端口進行監聽,Flume 通過 `avro Sink` 將數據源源不斷推送到該端口。