提供具體統計算法的工具。其算法可從數據中學習。
* [Apache Flink](https://flink.apache.org/):快速、可靠的大規模數據處理引擎。
* [Apache Hadoop](http://hadoop.apache.org/):在商用硬件集群上用來進行大規模數據存儲的開源軟件框架。
* [Apache Mahout](https://mahout.apache.org/):專注協同過濾、聚類和分類的可擴展算法。
* [Apache Spark](http://spark.apache.org/):開源數據分析集群計算框架。
* [DeepDive](http://deepdive.stanford.edu/):從非結構化數據建立結構化信息并集成到已有數據庫的工具。
* [Deeplearning4j](http://deeplearning4j.org/):分布式多線程深度學習開發庫。
* [H2O](http://0xdata.com/):用作大數據統計的分析引擎。
* [Weka](http://www.cs.waikato.ac.nz/ml/weka/):用作數據挖掘的算法集合,包括從預處理到可視化的各個層次。
- 前言
- 我們要做什么?
- 如何參與本項目?
- 本項目的參與者
- 古董級工具
- 構建工具
- 字節碼操作
- 集群管理
- 代碼分析
- 編譯器生成工具
- 外部配置工具
- 約束滿足問題求解程序
- 持續集成
- CSV解析
- 數據庫
- 數據結構
- 時間日期工具庫
- 依賴注入
- 開發流程增強工具
- 分布式應用
- 分布式數據庫
- 發布
- 文檔處理工具
- 函數式編程
- 游戲開發
- GUI
- 高性能計算
- IDE
- 圖像處理
- JSON
- JVM與JDK
- 基于JVM的語言
- 日志
- 機器學習
- 消息傳遞
- 雜項
- 應用監控工具
- 原生開發庫
- 自然語言處理
- 網絡
- ORM
- 性能分析
- 響應式開發庫
- REST框架
- 科學計算與分析
- 搜索引擎
- 安全
- 序列化
- 應用服務器
- 模板引擎
- 測試
- 通用工具庫
- 網絡爬蟲
- Web框架
- 資源
- 社區
- 有影響力的書
- 播客
- 微博、微信公眾號
- 知名網站