前置概念:
**Support**: 支持度 s(X->Y) =(XUY)/N;
**Confidence**: 置信度 c(X->Y) =(XUY)/(X);
**Frequent ItemSet**: 頻繁項集 Support >minSup;
?
**Apriori Principle**: 如果一個項集是頻繁的,那它所有的子項集也都是頻繁的。
?
**Frequent Itemset Generation in the AprioriAlgorithm:**
Apriori算法是第一個指出使用基于支持度剪枝策略的關聯規則挖掘算法,系統地控制候選項集的指數增長。
Ck代表k候選項集, Fk代表頻繁k項集
1 算法首先遍歷一遍數據集,檢測每項的支持度,獲取頻繁1-項集。Steps (1-2)
2 接下來,循環使用頻繁(k-1)-項集派生k-候選項集。Step (5)
3 遍歷數據集計算候選項集支持度Steps (6-10)
4 計算支持度后,消除非頻繁項集Step (12)
5 當沒有新的頻繁項集產生的時候,算法結束Step(13)
**Frequent itemset generation of the AprioriAlgorithm.**

**Rule generation:**
若果一個規則X->Y-X不滿足置信度閥值,那么所有的X’->Y-X’也不滿足閥值, 其中X’? X.
**Rule generation of the Apriori algorithm.**

?
**Procedure ap-genrules(fk, Hm).**

**總結:**
**核心思想:?????? 基于兩階段頻繁項集,挖掘關聯規則**
**算法優點:?????? 簡單、易理解、數據要求低**
**算法缺點:?????? I/O負載大,產生過多的候選項集**
**Apriori例題(Introduction to data mining):**


(b)16/32=50%
(c)11/32=34.4%
(d)5/32=15.6%
- 前言
- 插入排序
- 歸并排序
- 快速排序
- 最長公共子序列
- 斐波那契數列-臺階問題
- 求n*n階矩陣最大子矩陣階數
- 01背包
- 整數序列合并問題
- 動態規劃算法的一般解題思路
- 01背包-近似算法
- 樹搜索策略
- 求數組中的逆序對
- 并行機器最短調度問題
- 隨機算法
- 判斷兩多項式之積是否等于另一多項式
- 頂點覆蓋問題
- Apriori算法 (Introduction to data mining)
- 聚類算法-DBSCAN-C++實現
- 聚類算法-K-means-C++實現
- 聚類算法-Hierarchical(MIN)-C++
- 爬山法、分支限界法求解哈密頓環問題
- Best-First求解八數碼問題
- Naive Bayesian文本分類器