## 問題描述
我們在微博上采集了3306篇微博內容,并劃分成了4種類型。我們想對新的微博內容自動進行分類(4種類型中的一種)
請使用**樸素貝葉斯**訓練分類模型,并用測試集進行驗證,給出測試集的準確率。
數據集地址:https://github.com/cystanford/text_classification
數據說明:
1、文檔共有4中類型:女性、體育、文學、校園

2、訓練集放到train文件夾里,測試集放到test文件夾里。停用詞放到stop文件夾里。
