# 1. 數據集
評論文本將影評分為*積極(positive)*或*消極(nagetive)*兩類。[IMDB 數據集(IMDB dataset)](https://tensorflow.google.cn/api_docs/python/tf/keras/datasets/imdb?hl=zh_cn),其包含 50,000 條影評文本。從該數據集切割出的25,000條評論用作訓練,另外 25,000 條用作測試。訓練集與測試集是*平衡的(balanced)*,意味著它們包含相等數量的積極和消極評論。