案例初識 · Lucene案例開發

轉載請注明出處：[http://blog.csdn.net/xiaojimanman/article/details/43192055](http://blog.csdn.net/xiaojimanman/article/details/43192055) 首先抱歉，這幾天在準備案例的整體框架設計，所以更新就斷了幾天，還請原諒。 **案例整體介紹** 在我們開始正式的案例開發介紹之前，我們先看一下整體的案例demo介紹，明白案例是做什么的。 ![](https://box.kancloud.cn/2016-02-22_56ca7beeb7bc6.jpg) 從上圖中，我們可以看出，這個案例主要是通過爬蟲程序去采集縱橫小說上的資源，然后將資源存儲到自己的數據庫中，將數據庫中的需要檢索的數據通過lucene建立索引文件，最后通過web服務展示數據。這個過程中，我們需要編寫爬蟲（采集程序）、后臺接口（數據庫搜索&Lucene檢索）、web前端展示三個部分。下面就對這三個部分將會使用的技術做簡單的介紹。 **web前端** web前端將會基于BootStrap框架去做前端界面的設計，和后臺的數據交互將通過JavaScript。通過初步設計，前端主要包括四個界面：首頁（用作運營推廣使用）、書籍列表頁（用作關鍵詞、標簽、分類等檢索結果展示）、簡介頁、閱讀頁，四個頁面具體如下所示（這四個界面只是簡單草圖）：首頁將展示一些運營或推廣數據，數據由運營人員編寫。 ![](https://box.kancloud.cn/2016-02-22_56ca7beece1af.jpg) 列表頁主要用作書籍關鍵字、分類、標簽、作者、狀態等檢索結果展示。 ![](https://box.kancloud.cn/2016-02-22_56ca7beedce25.jpg) 簡介頁展示書籍的屬性信息及展示章節列表信息。 ![](https://box.kancloud.cn/2016-02-22_56ca7beeecf8c.jpg) 閱讀頁展示某一章節內容信息。 ![](https://box.kancloud.cn/2016-02-22_56ca7bef07564.jpg) **搜索后臺** 搜索后臺將主要基于lucene做信息檢索，數據庫將會使用mysql。搜索后臺提供web前端展示需要的數據接口。 ? ? ?? **爬蟲** 爬蟲程序將基于HttpClient模擬瀏覽器行為，采集縱橫小說網站內容（免費小說）。 ? ? ?? 這篇博客主要對案例的整體做簡單的介紹，知道這個案例是做什么的，不至于在后面的博客中不知道自己在做什么。 **注：**在開始介紹lucene搜索后臺前，將會在幾篇博客中，重點介紹搜索后臺用到的工具類。雖然有些類在之前的博客中也有相關的介紹，但這里還是會對這些類再次的介紹，以免在后面的代碼編寫過程中，找不到一些方法或不知道方法是做什么用的。 ps:最近發現其他網站可能會對博客轉載，上面并沒有源鏈接，如想查看更多關于 [基于lucene的案例開發](http://blog.csdn.net/xiaojimanman/article/category/2841877) 請[點擊這里](http://blog.csdn.net/xiaojimanman/article/category/2841877)。或訪問網址http://blog.csdn.net/xiaojimanman/article/category/2841877