## 啟信寶數據
### 數據維度?
* 啟信寶有哪些數據維度,數據來源是什么?
為了確保數據的質量,我們的數據來源有很多種:
* 購買的
* 合作的數據,對公開的數據進行交換
* 輿情:網絡爬蟲。
* 政府直接對接
進行交叉驗證。具體而言
* 工商信息來源企業信用信息公示系統,和工商內部數據,內部數據更新延遲較高,啟信寶進行多方驗證。
* 司法信息來源全國四級區縣、市級、省級、最高院5000多家,數據的全面性
* 知識產權等信息也來自各政府權威官網(國家知識產權網)
### 更新周期
* 數據更新周期?數據更新機制?數據是實時的嗎?
——對外——
在如此龐大的數據量基礎上,數據的更新機制分為周期更新和觸發式更新:
* 周期更新:對在庫的全量企業信息,根據企業所在地區的經濟發展情況、企業的熱度等分為不同梯隊: 江浙滬、北京、廣東等經濟發達地區區域2-3天更新,中部地區一周左右,偏遠地區兩周以內,個體戶1個月左右;
* 觸發式更新:對我們企業版、API等付費客戶,所查詢的企業都自動觸發更新;
* 企業版監控和API監控范圍內企業每天更新。
——對內——
首先說明數據量大。
啟信寶的數據以企業為主體,收錄了全國范圍內(包括香港))1.8億企業,其中有企業7千萬(異常狀態2千萬),個體1.1億,社會組織和律所140w,要實現T+1的更新不太現實。
所以我們采取了。
- 周期性更新:
- 江浙:優先更新,2~3天
- 中間:1~2周
- 偏遠:2周
- 個體:1個月
熱門T+1,2,全量5~10個工作日
- 觸發更新:
- 企業版觸發所有維度的更新,但是返回的有些數據更新時間會長一點,
- 接口:觸發工商更新
- 我們會選用相對合理的更新機制
- 對于實時接口
- 查本地庫,如果是今天的數據,就不會更新
- 如果不是今天的數據,將會更新
- 等待時間會長(商談每周更新是否合適)
### 數據準確性
全國各地的工商網站,相對于全國工商網站更新頻率會更快,因為地方是要更新到工商網站上的。
啟信寶的數據來源于政府的官網網站(企業信用信息公示網、裁判文書網、各級法院官網、國家版權局等)
在保證數據更新周期的情況下,與官網信息保持一致。并且在有啟信寶通過多方數據源對企業數據進行校驗,保證數據的準確性。
## 啟信寶產品
### 優勢
* 數據源:數據質量更高,主要為泛金融客戶提供服務,很多企業客戶驗證過了。
* 更全:全量的數據多方驗證果
* 保存了歷史數據