# 讀取UTF8-BOM多出字符
* * * * *
--: 作者:Fuzz
時間:2018年8月31日
* * * * *
### BOM頭是什么
BOM頭是放在UTF-8編碼的文件的頭部的,占用三個字節,用來標識該文件屬于UTF-8編碼。現在已經有很多軟件識別BOM頭,但是還有些不能識別BOM頭,比如PHP就不能識別BOM頭,這也是用記事本編輯UTF-8編碼后執行就會出錯的原因了。
### 對應的二進制與Unicode
#### Unicode字符
Unicode字符("\uFEFF")
#### 二進制
FE FF UTF16BE
FF FE UTF16LE
EF BB BF UTF8
### 出現原因
如果用windows自帶的文本編輯器編輯過文件,就會自動添加上BOM頭。
### 解決辦法
讀取文件時候去除 \uFEFF 內容