## 數據分析簡介
數據分析是指用合適的統計分析方法對收集來的數據進行分析,將這些大量的數據進行匯總,并做成可以被人們消化和理解的資料,從中提取有用的信息。數據分析常常以數和量的形式展現,通過實驗、觀察、調查等方式獲取結果。
## 數據分析的分類
盡管數據分析過程著重于清理、建模和可視化數據的任務,但數據分析的概念及其對企業的重要性不容小覷。 為了分析數據,分析的核心部分劃分為以下幾個類別:
* 說明性
* 診斷性
* 預測性
* 規范性
* 認知性
### 描述性分析
描述性分析有助于根據歷史數據回答有關發生了什么的問題。 描述性分析技術匯總了大型數據集,向利益干系人描述結果。
通過開發關鍵績效指標 (KPI),這些策略有助于跟蹤關鍵目標的成功或失敗情況。 許多行業都使用了投資回報率 (ROI) 等指標,某些行業還開發了專門用于跟蹤性能的指標。
描述性分析的示例包括生成報表來提供組織銷售和財務數據的視圖。
### 診斷分析
診斷分析有助于解答事件發生原因相關問題。 診斷分析技術是對基本描述性分析的補充,通過使用描述性分析的結果來發現這些事件發生的原因。 然后,進一步調查績效指標,以發現這些事件變得更好或更糟的原因。 此過程通常分為三個步驟:
1. 確定數據中的異常。 這些異常可能是指標或特定市場中發生的意外變化。
2. 收集與這些異常相關的數據。
3. 使用統計技術來發現用以解釋這些異常的關系和趨勢。
### 預測分析
預測分析有助于回答有關將來會發生什么的問題。 預測分析技術使用歷史數據來確定趨勢并確定它們是否有可能重復出現。 預測分析工具提供將來可能發生什么的有價值見解。 技術包括各種統計和機器學習技術,例如神經網絡、決策樹和回歸。
### 規范性分析
規范性分析有助于回答應采取哪些措施來實現目標的問題。 通過使用來自預測分析的見解,組織可基于數據制定決策。 此方法允許企業在面臨不確定性時做出明智的決策。 規范性分析技術依賴機器學習策略來找出大型數據集中的模式。 通過分析過去的決策和事件,組織可以估計不同結果的可能性。
### 認知分析
認知分析嘗試從現有數據和模式中進行推斷,并基于現有知識庫得出結論,然后將這些結果添加回知識庫,以供將來進行推斷,這是一個自學習反饋循環。 認知分析有助于了解如果情況發生變化可能發生什么,以及確定如何處理這些情況。
推斷不是基于規則數據庫的結構化查詢,而是從多個源收集的非結構化假設,并以不同的置信度表示。 有效的認知分析取決于機器學習算法,并使用多種自然語言處理概念來利用以前未使用過的數據源,例如呼叫中心對話日志和產品評審。