在機器學習任務的核心是訓練方式的選擇,包括以下功能:
2.3.1 普通訓練(Single Train)
普通訓練是指確定模型以及模型參數的訓練,適?用于有?一定機器?學習背景的?人員,可以針對特定的數據?自?己指定合適的模型及模型參數。
2.3.2 自動化超參訓練(Hyper Train)
平臺同時支持對模型的參數進行優化搜索,即自動化超參數調優,避免用戶手動調參的低效。這種模式下,用戶只需要上傳數據,選擇若干機器學習模型即可,平臺將自動搜索出每個模型的最優參數。包含的優化算法為:
· Grid\_Search
· Random\_Search
· SMAC
· TPE
· ANNEAL
2.3.3 集成訓練(Ensemble Train)
集成方法是將?種機器學習算法組合成?個預測模型的訓練方式,以達到減小方差、偏差或改進預測的效果。本平臺的集成訓練是基于 stacking 的集成學習技術,通過元分類器或元回歸(Meta-Model )聚合多個基分類或回歸模型( Base-Model )。其中基模型( Base-Model ) 基于完整的訓練數據進行訓練,然后元模型( Meta-Model )基于基模型的輸出結果進行訓練。
2.3.4 模型評估
任務設置中支持多種機器學習模型的技術評估指標,分別如下:
分類評估:
· 準確率
· 召回率
· F1分數
· ROC曲線
· AUC
· KS
回歸評估:
· MAE
· MSE
· RMSE
· MSLE
· MDAE
· R Square
· MAPE
聚類評估
· ARI
· FMI
· SC
· CHI
時間序列評估
· 殘差平方和
· 殘差圖