轉載請注明出處:[http://blog.csdn.net/xiaojimanman/article/details/43192055](http://blog.csdn.net/xiaojimanman/article/details/43192055)
首先抱歉,這幾天在準備案例的整體框架設計,所以更新就斷了幾天,還請原諒。
**案例整體介紹**
在我們開始正式的案例開發介紹之前,我們先看一下整體的案例demo介紹,明白案例是做什么的。

從上圖中,我們可以看出,這個案例主要是通過爬蟲程序去采集縱橫小說上的資源,然后將資源存儲到自己的數據庫中,將數據庫中的需要檢索的數據通過lucene建立索引文件,最后通過web服務展示數據。這個過程中,我們需要編寫爬蟲(采集程序)、后臺接口(數據庫搜索&Lucene檢索)、web前端展示三個部分。下面就對這三個部分將會使用的技術做簡單的介紹。
**web前端**
web前端將會基于BootStrap框架去做前端界面的設計,和后臺的數據交互將通過JavaScript。通過初步設計,前端主要包括四個界面:首頁(用作運營推廣使用)、書籍列表頁(用作關鍵詞、標簽、分類等檢索結果展示)、簡介頁、閱讀頁,四個頁面具體如下所示(這四個界面只是簡單草圖):
首頁將展示一些運營或推廣數據,數據由運營人員編寫。

列表頁主要用作書籍關鍵字、分類、標簽、作者、狀態等檢索結果展示。

簡介頁展示書籍的屬性信息及展示章節列表信息。

閱讀頁展示某一章節內容信息。

**搜索后臺**
搜索后臺將主要基于lucene做信息檢索,數據庫將會使用mysql。搜索后臺提供web前端展示需要的數據接口。
? ? ??
**爬蟲**
爬蟲程序將基于HttpClient模擬瀏覽器行為,采集縱橫小說網站內容(免費小說)。
? ? ??
這篇博客主要對案例的整體做簡單的介紹,知道這個案例是做什么的,不至于在后面的博客中不知道自己在做什么。
**注:**在開始介紹lucene搜索后臺前,將會在幾篇博客中,重點介紹搜索后臺用到的工具類。雖然有些類在之前的博客中也有相關的介紹,但這里還是會對這些類再次的介紹,以免在后面的代碼編寫過程中,找不到一些方法或不知道方法是做什么用的。
ps:最近發現其他網站可能會對博客轉載,上面并沒有源鏈接,如想查看更多關于 [基于lucene的案例開發](http://blog.csdn.net/xiaojimanman/article/category/2841877) 請[點擊這里](http://blog.csdn.net/xiaojimanman/article/category/2841877)。或訪問網址http://blog.csdn.net/xiaojimanman/article/category/2841877
- 前言
- 寫在開始之前
- lucene初始認知
- 索引數學模型
- 索引文件結構
- 創建索引
- 搜索索引
- 分詞器介紹
- Query查詢
- IndexSearcher中檢索方法
- 更新說明
- 案例初識
- JsonUtil & XmlUtil
- 基ClassUtil & CharsetUtil
- ParseUtil & ParseRequest
- 數據庫連接池
- 實現實時索引基本原理
- 實時索引管理類IndexManager
- 實時索引的檢索
- 實時索引的修改
- 查詢語句創建PackQuery
- 縱橫小說更新列表頁抓取
- 縱橫小說簡介頁采集
- 縱橫小說章節列表采集
- 縱橫小說閱讀頁采集
- 縱橫小說數據庫設計
- 縱橫小說數據庫操作
- 縱橫小說分布式采集