## 分層隨機分裂
> 類似于RandomSpilt類樣本分為兩組:訓練組和測試組。樣本的分布考慮了他們的目標并試圖將它們平分。您可以調整每組中的樣本數。
### 構造函數參數
`$dataset ` - 實現數據集接口的對象
`$testSize` - 測試拆分的一小部分(浮點數,從0到1,默認值:0.3)
`$seed` - 隨機生成器的種子(例如用于測試)
```
$split = new StratifiedRandomSplit($dataset, 0.2);
```
*****
### 樣品和標簽組
要從測試和訓練組中獲取樣本或標簽,您可以使用getter:
```
$dataset = new StratifiedRandomSplit($dataset, 0.3, 1234);
// train group
$dataset->getTrainSamples();
$dataset->getTrainLabels();
// test group
$dataset->getTestSamples();
$dataset->getTestLabels();
```
## 例
```
$dataset = new ArrayDataset(
$samples = [[1], [2], [3], [4], [5], [6], [7], [8]],
$targets = ['a', 'a', 'a', 'a', 'b', 'b', 'b', 'b']
);
$split = new StratifiedRandomSplit($dataset, 0.5);
```
拆分將等于每個目標的數量。兩個目標a和兩個b。
- 基本介紹
- 關聯規則學習
- 分類
- SVC
- k近鄰算法
- NaiveBayes
- 回歸
- 最小二乘法
- SVR
- 聚類
- k均值聚類算法
- DBSCAN聚類算法
- 公
- 準確性
- 混亂矩陣
- 分類報告
- 工作流程
- 神經網絡
- 交叉驗證
- 隨機拆分
- 分層隨機分裂
- 特征選擇
- 方差閾值
- 特征選擇
- 預處理
- 標準化
- 缺失值補全
- 特征提取(自然語言)
- 令牌計數矢量化器(文本處理)
- Tf-idf轉換
- 數據集
- ArrayDataset
- CsvDataset
- FilesDataset
- SvmDataset
- MnistDataset
- 準備使用數據集
- Iris Dataset
- Wine Dataset
- Glass Dataset
- 模型管理
- 數學
- 距離
- 矩陣
- 組
- 統計