DBSCAN聚類算法 · PHP-ML中文文檔

## DBSCAN集群 > 它是一種基于密度的聚類算法：給定一些空間中的一組點，它將緊密堆積在一起的點（具有許多鄰近鄰居的點）組合在一起，標記為僅在低密度區域中存在的異常點（最近的點）鄰居們太遠了）。DBSCAN是最常見的聚類算法之一，也是科學文獻中引用最多的算法。 > ***** ### 構造函數參數 `$epsilon` - epsilon，兩個樣本之間的最大距離，以便將它們視為在同一鄰域中 `$minSamples` - 要被視為核心點的鄰域中的樣本數（這包括點本身） `$distanceMetric` - 距離對象，默認為歐幾里德 ``` $dbscan = new DBSCAN($epsilon = 2, $minSamples = 3); $dbscan = new DBSCAN($epsilon = 2, $minSamples = 3, new Minkowski($lambda=4)); ``` ***** ## 聚類要將樣本分成簇，只需使用`cluster`方法。它返回帶有樣本的簇`array`。 ``` $samples = [[1, 1], [8, 7], [1, 2], [7, 8], [2, 1], [8, 9]]; $dbscan = new DBSCAN($epsilon = 2, $minSamples = 3); $dbscan->cluster($samples); // return [0=>[[1, 1], ...], 1=>[[8, 7], ...]] ```