4.1 為什么要總結數據？ · 斯坦福 Stats60 21 世紀的統計思維

## 4.1 為什么要總結數據？當我們總結數據時，我們必然會丟棄信息，對此有許多可以想象的反對意見。作為一個例子，讓我們回到我們在第 1 章中討論的純研究。除了數據集中總結的那些細節之外，我們是否不應該相信每個單獨的事物的所有細節？關于如何收集數據的具體細節，如一天中的時間或參與者的心情，如何？當我們總結數據時，所有這些細節都會丟失。我們一般總結數據，因為它為我們提供了一種概括 _ 的方法，也就是說，使一般性陳述超出特定的觀察范圍。作家豪爾赫·路易斯·博爾赫斯（JorgeLuisBorges）在其短篇小說《取笑記憶》（funes the memorious）中強調了概括的重要性，該小說描述了一個失去遺忘能力的人。博爾赫斯專注于歸納（即扔掉數據）和思考之間的關系：“思考就是忘記差異，歸納，抽象。在富麗堂皇的 funes 世界里，只有細節。”_ 心理學家長期以來研究了歸納法對思維的核心作用。一個例子是分類：我們能夠很容易地識別“鳥類”類別的不同例子，即使個別例子在表面特征上可能非常不同（例如鴕鳥、知更鳥和雞）。重要的是，泛化可以讓我們對這些個體做出預測——就鳥類而言，我們可以預測它們會飛和吃蠕蟲，它們可能不會開車或說英語。這些預測并不總是正確的，但它們往往足夠好，能夠在世界上發揮作用。