轉載請注明出處:[http://blog.csdn.net/xiaojimanman/article/details/42804365](http://blog.csdn.net/xiaojimanman/article/details/42804365)
自己從事java開發工作已將近兩年的時間,這中間自己也學過不少東西,也寫過不少東西,但是從來沒有系統的介紹過任何一項技術。因此,自己打算從這篇博客開始,系統化的介紹一下如何基于lucene開發一個實際的案例。
lucene是自己接觸java的第一個技術,自己也用lucene做過不少搜索后臺,比如小說、漫畫、新聞、視頻、游戲等等,所以自己在lucene開發上還是稍微有點經驗的。關于這個系列的案例選擇上自己也有過糾結,最初的想法是想選擇新聞這個板塊的(因為自己手上有現成的代碼,這樣自己估計在后面的博客更新速度上會很快),但是發現就是有人按照我這博客實現了這個新聞的檢索,好像也不會有什么成就感吧,在實際的學習、生活、娛樂上也不會有太大的作用,所以最后選擇了小說這個模塊。當然小說對學習是沒有太大的幫助的,但如果真的實現了這個項目,這樣以后就不需要去其他的地方去看小說了,完全可以在自己的系統上去看下說(由于版權問題,自己看就好,別公開,要不可能會吃官司的)。話說的有點遠,回歸主題,對于這系列的博客,自己打算分四大部分介紹
第一部分:lucene的基本原理以及API簡單接口的使用
第二部分:基于lucene4.3.1創建小說實時索引后臺
第三部分:某一個站點的小說信息采集(具體是哪一個站點,等到了這一部分再確定;采集并不是自己擅長的部分,這部分在實現上估計會有諸多漏洞,還請見諒)
第四部分:BS模式設計系統前端展示
上面四大部分,第三、第四部分自己并不是太擅長,到時候如果有漏洞,還請多多指正;自己即將開始自己的lucene案例開發之旅,祝福自己可以順利完成吧。
- 前言
- 寫在開始之前
- lucene初始認知
- 索引數學模型
- 索引文件結構
- 創建索引
- 搜索索引
- 分詞器介紹
- Query查詢
- IndexSearcher中檢索方法
- 更新說明
- 案例初識
- JsonUtil & XmlUtil
- 基ClassUtil & CharsetUtil
- ParseUtil & ParseRequest
- 數據庫連接池
- 實現實時索引基本原理
- 實時索引管理類IndexManager
- 實時索引的檢索
- 實時索引的修改
- 查詢語句創建PackQuery
- 縱橫小說更新列表頁抓取
- 縱橫小說簡介頁采集
- 縱橫小說章節列表采集
- 縱橫小說閱讀頁采集
- 縱橫小說數據庫設計
- 縱橫小說數據庫操作
- 縱橫小說分布式采集