### faiss
AI相似性搜索工具
能使開發者快速搜索相似多媒體文件的算法庫。
faiss的所有算法都是圍繞index展開的。不管運行搜索還是聚類,首先都要建立一個index。
- 相似性搜索的本質
傳統數據庫由包含符號信息的機構表組成,比如,一個圖像集,會用每行一張索引照片的列表表示。
很多AI工具都會產生高維**矢量**,比如像 **word2vec** 這樣的文本嵌入工具,以及用深度學習訓練的CNN描述符。
這些表示比固定的符號表示更加強大靈活。但用SQL來檢索的傳統數據庫并沒有適配這些新型表示。
首先,海量的新多媒體流創造了數十億的矢量。其次,而且更為重要的是,找到相似的條目意味著找到相近的高維矢量。
而對于當下的標準檢索語言,這是極度低效、甚至無法實現的。
- 如何使用矢量表示?
分類器的訓練
- 軟件包
現有的軟件工具,不足以完成上述數據庫搜索操作。傳統的SQL數據庫系統可用性不高,因為它們是 hash-based searches 或 1D interval searches 而優化。
#### 1. faiss的優缺點
- 提供數個相似性搜索方法,這些方法針對不同使用情況,提供跨度很大的功能取舍。
- 為內存的使用和速度而優化。
- 為相關索引方法提供了最前沿的GPU執行方案。
#### 2. 相似性搜索評估
一旦這些矢量被學習機提取出來(從圖像、視頻、文本文件或者其他渠道),它們就已經可以被輸入進相似性搜索庫。
#### 3. 十億個矢量的評估
#### 4. 選擇索引
[ubuntu 16.04 環境安裝faiss](https://blog.csdn.net/cym1990/article/details/79528822)
- 在看的書和文章
- Java程序員手冊
- 思維方式
- 面向服務
- Dubbo
- StringBoot
- 001.應用部署
- 002.注解學習
- SpringCloud
- SpringCloud入門
- Dbs
- 分布式
- Ffp
- 多線程
- 多線程小知識
- Java鎖認識
- Netty
- Netty學習目錄
- 讀寫事件流程分析與相關API
- 數據
- 大數據學習
- 學習目錄
- Hadoop學習
- Hadoop組建安裝
- ssh配置免密登陸
- Hadoop偽集群模式
- HBase偽集群模式
- Hive安裝
- 常用操作命令
- 問題記錄
- DOLIST
- 學習資料
- Spark
- 一些概念介紹
- 數據庫
- Oracle相關
- 批量測試數據生成
- MySQL相關
- Redis
- 常用操作
- 機器學習
- 認識
- Kafka
- 監控
- 分布式相關
- RPC
- 中間件
- ElasticSearch
- ES環境搭建
- Python客戶端創建索引
- Es的api常用操作
- SQL查詢引擎
- Es數DB的數據同步
- ActiveMQ
- ActiveMQ介紹
- 分享
- Skyeye
- 組件安裝配置
- Dubbo服務Demo應用部署
- Kafka安裝配置
- RabbitMq配置
- Docker
- Docker學習文章
- Docker的大數據平臺之路
- Docker環境搭建
- ubuntu16安裝docker
- Docker鏡像加速
- 使用Docker快速搭建中間件
- Docker環境使用mysql
- Docker環境的中間件搭建匯總
- Docker鏡像容器管理
- Docker鏡像創建
- Docker創建可用的系統容器
- Kubernetes
- etcd安裝
- flanneld安裝
- kubernetes環境安裝
- kubernetes源碼編譯
- Linux相關
- Linux操作系統
- Deepin操作系統
- 新系統環境準備
- Linux系統小工具
- Linxu配置時間服務器同步
- DNS服務器dnsmasq
- Linux命令
- 常用命令
- 計算機基礎
- README
- 數據結構
- 面試題總結
- 計算機組層原理
- 計算機組層原理
- 其它語言
- Python
- Python環境搭建
- Python學習總結
- Python語法學習
- Python模塊學習
- MySQLdb
- scrapy
- Python的exception
- PythonNLP入門
- Go
- 工具組件
- Jenkins
- Jenkins認識
- Jenkins安裝配置
- Jenkins插件使用
- Jenkins項目常用配置
- Git
- Git使用說明
- NLP
- 入門級別
- 一些概念
- faiss介紹
- WMD介紹