## **私有語料庫**
**單條新增**
點擊“新增問題”,在新打開的頁面里補充標準問題(不超過64個字符)、標準答案(不超過500個字符)。
* * * * *
**語料庫空間**
語料庫空間為語料存儲總量,根據版本不同存儲總量也不同:
免費版存儲總量100條,每日可導入數量100條;
標準版存儲總量1000條,每日可導入數量1000條;
專業版存儲總量10000條,每日可導入數量5000條;
* * * * *
**匹配度**
是一個客戶可自定義設置知識庫語義相似度的開關,不同閾值有不同的效果:
如果閾值設置為100%,則為完全匹配,即當用戶問題與知識庫問題完全一致的情況下才能觸發相應答案。該閾值下準確率高,但適用于業務問答且對準確度要求較高的用戶。
如果閾值設置為60%,則為模糊匹配,即當用戶問題與知識庫問題相似度達到60%,即可觸發相應答案。該閾值覆蓋率與準確率適中,適用于大部分用戶。
如果閾值設置為10%,即當用戶問題與知識庫相似度達到10%,就會觸發相應答案,雖然該閾值回復知識庫內容的幾率增加,但準確率較低。適用于知識庫問題較少,且關鍵詞重復率低的用戶。
* * * * *
**語料庫純凈度**
對用戶上傳的問題和答案,圖靈盾會做違規詞檢測,如果發現有涉黃、涉暴、涉政等違規詞,圖靈盾會對該問題或答案高亮顯示,并標記出具體的違規詞,便于用戶快速定位并修改違規詞。
高亮顯示說明:
橙色代表疑似違規詞,建議修改,但仍可以對外輸出;
紅色代表嚴重違規詞,必須修改,否則無法對外輸出。
* * * * *
**批量導入**
批量導入主要為用戶提供便捷的導入方式。在用戶下載“語料庫模板”后,可按語料庫模板的格式設置問題、答案和相似問法。
請注意:
1.導入條數與收費版本相關,文件大小不超過5M。
2.如新導入的問題與原問題一致,導入的問題只會新增,不會覆蓋。
* * * * *
**批量操作**
可對語料進行批量刪除、停用和啟用,停用即為暫時不使用該語料,但不會刪除。
* * * * *
**語料庫導出**
語料庫導出主要為方便用戶批量修改問題和答案。目前只有標準版以上權限才可導出語料庫,標準版導出次數1次/周;專業版不限導出次數。
* * * * *
**關鍵詞**
該功能主要為了增加長句中關鍵詞的匹配權重,從而提高回復的準確率。關鍵詞工作邏輯主要為加權+完全匹配,所以在設置關鍵詞時盡量遵循以下原則:
* 多個關鍵詞的情況下,不要設置近義詞,要設置會在一句話里同時出現的詞;
* 如果需要通過關鍵詞設置來提升匹配精度,那么關鍵詞粒度要細,如“AAA價格”“AAA選型”這兩個問題,可分別將“價格”“選型”設置為關鍵詞,如果還有“BBB的價格”“BBB的選型”這些問題,那么就要將”AAA”,”BBB”也分別設置為關鍵詞;
* 避免使用短語,盡量使用單詞作為關鍵詞,提升關鍵詞的命中率。
## **同義詞庫**
**同義詞庫說明**
同義詞是指相同語義的關鍵詞,主要用來提高私有語料被命中的概率。如“蘋果”的同義詞為“iphone”,則當用戶說“蘋果多少錢”或“iphone多少錢”時,都能匹配到同一個答案進行回復。
**同義詞庫使用方式**
* 未設置同義詞回復

* 設置相關同義詞

* 設置同義詞回復

## **素材庫**
**素材庫說明**
素材可以用在私有語料庫中作為答案回復給用戶,系統會定期自動檢索更新您微信公眾號中的素材。如果你在微信平臺中添加了素材,最多需要十五分鐘即可完成同步。
**素材庫使用流程**
* 綁定微信公眾號

* 素材庫會自動同步公眾號圖文、圖片等信息

* 新增語料庫圖文內容

* 回復用戶圖文

* * * * *
## **知識雷達**
**知識雷達說明**
知識雷達使私有語料庫里的回答設置更準確,如嗅探詞為“學習”,則當用戶說“怎么學習”或“如何學習”時,都能被捕捉到表格中。嗅探詞可設置多個,但不能對多個嗅探詞同時進行捕捉。
**知識雷達使用方式**
* 開啟知識雷達,設置嗅探詞語

* 自動捕捉用戶與機器人對話中包含嗅探詞的語料

* 可將未覆蓋到的語料,添加為新問題
