## 問題描述
泰坦尼克海難是20世紀人間十大災難之一。在1912年4月15日,載著1316號乘客和891名船員的豪華巨輪“泰坦尼克號”與冰山相撞而沉沒。船難發生后,究竟有多少人葬身海底呢?各方面的統計不一。有些消息來源說是1635人,美國調查庭說是1517人,英國調查庭說時1490人,而英國貿易局則說是1503人。
我們現在得到了部分的數據,具體數據見
https://github.com/cystanford/Titanic_Data
數據集格式為csv,一共兩個文件:
train.csv:訓練數據集,包含特征信息和存活與否的標簽
test.csv: 測試數據集,只包含特征信息
現在請用**決策樹分類**對訓練集進行訓練,并針對測試集中的乘客進行生存預測,并告知分類器的準確率。
在測試集中,包括了以下字段,具體描述為:
| 字段 |描述 |
| --- | --- |
|PassengerId | 乘客編號 |
|Survived | 是否幸存 |
|Pclass | 船票等級 |
|Name | 乘客姓名 |
|Sex | 乘客性別 |
|SibSp |親戚數量(兄妹、配偶數) |
|Parch|親戚數量(父母、子女數)|
|Ticket|船票號碼|
|Fare|船票價格|
|Cabin|船艙|
|Embarked|登陸港口|