Spark MLib是Spark提供的機器學習庫,它提供了如下工具:
(1)ML 算法:通用學習算法,如分類,回歸,聚類和協同過濾;
(2)特征工程:特征提取,轉換,降維和選擇;
(3)管道:用于構建,評估和調整 ML 管道的工具;
(4)持久性:保存和加載算法,模型和管道;
(5)實用程序:線性代數,統計,數據處理等;
:-: 
官方文檔:http://spark.apache.org/docs/latest/ml-guide.html