## DBSCAN集群
> 它是一種基于密度的聚類算法:給定一些空間中的一組點,它將緊密堆積在一起的點(具有許多鄰近鄰居的點)組合在一起,標記為僅在低密度區域中存在的異常點(最近的點)鄰居們太遠了)。DBSCAN是最常見的聚類算法之一,也是科學文獻中引用最多的算法。
>
*****
### 構造函數參數
`$epsilon` - epsilon,兩個樣本之間的最大距離,以便將它們視為在同一鄰域中
`$minSamples` - 要被視為核心點的鄰域中的樣本數(這包括點本身)
`$distanceMetric` - 距離對象,默認為歐幾里德
```
$dbscan = new DBSCAN($epsilon = 2, $minSamples = 3);
$dbscan = new DBSCAN($epsilon = 2, $minSamples = 3, new Minkowski($lambda=4));
```
*****
## 聚類
要將樣本分成簇,只需使用`cluster`方法。它返回帶有樣本的簇`array`。
```
$samples = [[1, 1], [8, 7], [1, 2], [7, 8], [2, 1], [8, 9]];
$dbscan = new DBSCAN($epsilon = 2, $minSamples = 3);
$dbscan->cluster($samples);
// return [0=>[[1, 1], ...], 1=>[[8, 7], ...]]
```
- 基本介紹
- 關聯規則學習
- 分類
- SVC
- k近鄰算法
- NaiveBayes
- 回歸
- 最小二乘法
- SVR
- 聚類
- k均值聚類算法
- DBSCAN聚類算法
- 公
- 準確性
- 混亂矩陣
- 分類報告
- 工作流程
- 神經網絡
- 交叉驗證
- 隨機拆分
- 分層隨機分裂
- 特征選擇
- 方差閾值
- 特征選擇
- 預處理
- 標準化
- 缺失值補全
- 特征提取(自然語言)
- 令牌計數矢量化器(文本處理)
- Tf-idf轉換
- 數據集
- ArrayDataset
- CsvDataset
- FilesDataset
- SvmDataset
- MnistDataset
- 準備使用數據集
- Iris Dataset
- Wine Dataset
- Glass Dataset
- 模型管理
- 數學
- 距離
- 矩陣
- 組
- 統計