### 開篇
商業智能系統,Business Intelligence,BI,數據中心,叫法各異,職責相同,以下統一稱為BI系統。
BI負載對于公司的運營效果、系統的運行情況及改版效果,基于數據層面,進行比較客觀的統計和分析,為高層管理人員對于公司運營、為產品部門對于網站的設計及改版或算法調整前后效果,提供參考及考量。
BI系統的職責是統計分析相關的,對數據的實時性要求不高,允許一天以上的數據延遲;對于和具體的業務密切相關的、或者實時性要求高的統計分析,則不應該放到BI系統,而是應該放在各自的業務支持系統中去。
BI系統是一個數據系統,用來幫助企業更好地利用數據提高決策質量的技術集合,是從大量的數據中鉆取信息與知識的過程。簡單講就是業務、數據、數據價值應用的過程。基礎的BI是統計分析,BI的進階是決策支持,從“之前發生了什么,為什么會發生”,到“現在發生了什么,將來會發生什么”。
### 名詞解釋
BI:商業智能(Business Intelligence)
ETL: ?提取、轉換和加載(Extraction-Transformation-Loading)
ODS:操作型數據存儲( Operational Data Storage )
DW:數據倉庫(Data Warehouse)
DM: 數據集市 (Data Mar) 、 ? 數據挖掘(Data Mining)
OLAP:聯機分析處理(Online Analysis Process)
### 系統解決辦法
(1)根據統計的需要,進行數據抽取,從業務系統數據庫中,抽取到BI數據庫
? (a)、抽取的過程中,可能是每天定時、每小時定時、觸發等方式,具體是要根據具體的場景
? (b)、抽取的邏輯,要能保證重復抽取,比如某天數據出現問題時。。。
? (c)、抽取的過程,可能涉及一些計算邏輯,比如對于毛利率的計算,需要商品的成本價,對于成本價的獲取,可能就有一些邏輯
? (d)、數據抽取的辦法,可以引入能簡化開發工作量的第三方框架,比如dataX
(2)數據收集
? (a)、數據置標:根據業務的需要,一些數據需要置標,通過日志進行分析,或者把標記記錄到數據庫中,比如下單的:source、ref、pos
? (b)、網站流量:插碼或者分析日志,[http://blog.csdn.net/puma_dong/article/details/38943251#t12](http://blog.csdn.net/puma_dong/article/details/38943251#t12)
? (c)、日志分析:收集用戶訪問路徑,停留時間,退出頁等
(3)結果呈現
? (a)、使用好的JS框架圖形化呈現BI報表,比如JQuery插件,但是不推薦ExtJS框架,太過于封裝及學習成本的原因
? (b)、短信提醒,重要結果的提醒
(4)公式定義
? (a)BI的產品定義,對要展示數據內容的明確定義,比如毛利率公式、轉化率等。
### 系統功能設置
呈現:
(1)實時數據報表
(2)訂單售后相關報表
(3)商品庫存相關報表
(4)渠道廣告相關報表
(5)網站流量相關報表
數據:
(1)流量統計
(2)數據抽取中間件
### 待續
沒有骨架就沒有血肉,所謂皮之不存,毛將焉附,想到一點就寫下來,后續補充。。。