轉載請注明出處:[http://blog.csdn.net/xiaojimanman/article/details/43194793](http://blog.csdn.net/xiaojimanman/article/details/43194793)
這篇博客主要介紹ClassUtil類和CharsetUtil類。這兩個也是項目中比較常用的類,一個用于指定文件路徑,一個用于檢測文件的編碼方式。
**ClassUtil**
ClassUtil類中的方法主要是返回class文件所在的文件目錄或工程的根目錄地址,這主要用于指定工程中配置文件的路徑,不至于環境遷移而導致配置文件路徑錯誤。源代碼如下:
~~~
/**
* @Description: 類工具
*/
package com.lulei.util;
public class ClassUtil {
/**
* @param c
* @return
* @Description: 返回類class文件所在的目錄
*/
public static String getClassPath(Class<?> c) {
return c.getResource("").getPath().replaceAll("%20", " ");
}
/**
* @Description:
* @param c
* @param hasName 是否顯示文件名
* @return 返回類class文件的地址
*/
public static String getClassPath(Class<?> c, boolean hasName) {
String name = c.getSimpleName() + ".class";
String path = c.getResource(name).getPath().replaceAll("%20", " ");
if (hasName) {
return path;
} else {
return path.substring(0, path.length() - name.length());
}
}
/**
* @Description: 返回類class文件所在的頂級目錄
* @param c
* @return
*/
public static String getClassRootPath(Class<?> c) {
return c.getResource("/").getPath().replaceAll("%20", " ");
}
public static void main(String[] args) {
System.out.println(ClassUtil.getClassPath(ClassUtil.class, true));
System.out.println(ClassUtil.getClassPath(Math.class, true));
System.out.println(ClassUtil.getClassRootPath(Math.class));
}
}
~~~
main函數運行結果如下:

**CharsetUtil**
CharsetUtil類是基于cpdetector第三方jar包實現的編碼檢測工具類。如果接觸過實際項目,你絕對會碰到程序讀取文件亂碼或更新運營文件網站就無法正常顯示等一系列問題,而這些問題多數都是因為文件編碼問題導致的。當然這個工具類,在下一部分的爬蟲程序中也扮演著重要的角色。源程序如下:
~~~
/**
*@Description: 編碼方式檢測類
*/
package com.lulei.util;
import java.io.IOException;
import java.io.InputStream;
import java.net.URL;
import java.nio.charset.Charset;
import info.monitorenter.cpdetector.io.ASCIIDetector;
import info.monitorenter.cpdetector.io.CodepageDetectorProxy;
import info.monitorenter.cpdetector.io.JChardetFacade;
import info.monitorenter.cpdetector.io.ParsingDetector;
import info.monitorenter.cpdetector.io.UnicodeDetector;
public class CharsetUtil {
private static final CodepageDetectorProxy detector;
static {//初始化探測器
detector = CodepageDetectorProxy.getInstance();
detector.add(new ParsingDetector(false));
detector.add(ASCIIDetector.getInstance());
detector.add(UnicodeDetector.getInstance());
detector.add(JChardetFacade.getInstance());
}
/**
* @param url
* @param defaultCharset
* @Author:lulei
* @return 獲取文件的編碼方式
*/
public static String getStreamCharset (URL url, String defaultCharset) {
if (url == null) {
return defaultCharset;
}
try {
//使用第三方jar包檢測文件的編碼
Charset charset = detector.detectCodepage(url);
if (charset != null) {
return charset.name();
}
} catch (Exception e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
}
return defaultCharset;
}
/**
* @param inputStream
* @param defaultCharset
* @return
* @Author:lulei
* @Description: 獲取文件流的編碼方式
*/
public static String getStreamCharset (InputStream inputStream, String defaultCharset) {
if (inputStream == null) {
return defaultCharset;
}
int count = 200;
try {
count = inputStream.available();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
try {
//使用第三方jar包檢測文件的編碼
Charset charset = detector.detectCodepage(inputStream, count);
if (charset != null) {
return charset.name();
}
} catch (Exception e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
}
return defaultCharset;
}
public static void main(String[] args) throws Exception {
URL url = new URL("http://www.csdn.net");
System.out.println(CharsetUtil.getStreamCharset(url, "default"));
}
}
~~~
main函數運行結果如下:

ps:最近發現其他網站可能會對博客轉載,上面并沒有源鏈接,如想查看更多關于[ 基于lucene的案例開發](http://blog.csdn.net/xiaojimanman/article/category/2841877) 請[點擊這里](http://blog.csdn.net/xiaojimanman/article/category/2841877)。或訪問網址http://blog.csdn.net/xiaojimanman/article/category/2841877
- 前言
- 寫在開始之前
- lucene初始認知
- 索引數學模型
- 索引文件結構
- 創建索引
- 搜索索引
- 分詞器介紹
- Query查詢
- IndexSearcher中檢索方法
- 更新說明
- 案例初識
- JsonUtil &amp; XmlUtil
- 基ClassUtil &amp; CharsetUtil
- ParseUtil &amp; ParseRequest
- 數據庫連接池
- 實現實時索引基本原理
- 實時索引管理類IndexManager
- 實時索引的檢索
- 實時索引的修改
- 查詢語句創建PackQuery
- 縱橫小說更新列表頁抓取
- 縱橫小說簡介頁采集
- 縱橫小說章節列表采集
- 縱橫小說閱讀頁采集
- 縱橫小說數據庫設計
- 縱橫小說數據庫操作
- 縱橫小說分布式采集