
登陸成功后,可以啟動機器學習訓練任務流程,簡要的流程如下:
(1)數據上傳
ORION公有云版本支持結構化數據上傳(CSV文件),在數據模塊,點擊“上傳新數據” ,出現如下頁面:
· 需要用戶命名數據集
· 生成ID列:若數據集內無Index,則可滑動確認,平臺將自動生成索引列
· 將數據文件拖拽至平臺選框內
數據上傳中,進度條顯示數據上傳進度,完成后,點擊上傳按鈕,進入數據預覽頁面。

(2)數據預覽及下載
數據預覽可預覽數據集前十行,并可在所有數據中下載已上傳的數據集。

(3)創建任務
在訓練模塊中,點擊“創建任務”,彈出創建任務的窗口,包含如下內容:
· 任務名稱:用戶需要為新任務命名;
· 數據名稱:點擊窗口,出現下拉框,可選擇已上傳的數據集;
· 模型類型:可選擇非網絡模型,網絡模型(包含DNN,CNN,RNN,TCN)
· 問題類型:支持分類,回歸,聚類,時間序列問題
· 任務類型:包含手動訓練(single train),自動訓練(hyper train),集成訓練(ensemble train)
用戶可根據任務目標選擇配置,點擊創建任務進入下一步。

(4)任務配置
任務配置包含四個步驟:配置預處理,配置數據,選擇算法,配置輸出
· 配置預處理
配置預處理中是對數據集的預處理操作,包含如下可配置內容:
o ID列名:即指定數據集中的索引列,可通過下拉框選擇;
o Target列名:為需要預測的列名;
o Shuffle:是否需要隨機打亂數據(非時間序列數據可選);
o Do\_re\_fit:是否合并訓練與測試數據再次訓練,若是則置為True,默認不選擇;
o 數據切割形式:將數據集分為訓練集和測試集的方式與比例;

· 配置數據
配置數據中,用戶可對每一列數據進行預處理,包括數據變換和空值處理,用戶無需編程,可對數據進行快速預處理,同時可對數據進行理解,包含數據最大最小值,缺失值比例等。

· 選擇算法
在算法選擇模塊中,用戶可對算法進行選擇與配置,以全連接神經網絡為例,用戶可視化選擇全連接層數,每層單元數,及網絡參數等,用戶可以選擇默認配置進行下一項目。

· 評估方法
在模型指標的選擇中,用戶可自定義選擇指標,可多選。

用戶完成四個步驟后,用戶可在所有任務的列表內查看待訓練的任務,并可查看訓練進度:


訓練任務成功完成后,后臺將保存任務,并可在預測任務內調用。
