<ruby id="bdb3f"></ruby>

    <p id="bdb3f"><cite id="bdb3f"></cite></p>

      <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
        <p id="bdb3f"><cite id="bdb3f"></cite></p>

          <pre id="bdb3f"></pre>
          <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

          <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
          <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

          <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                <ruby id="bdb3f"></ruby>

                企業??AI智能體構建引擎,智能編排和調試,一鍵部署,支持知識庫和私有化部署方案 廣告
                # 二、因果和實驗 > 原文:[Causality and Experiments](https://github.com/data-8/textbook/tree/gh-pages/chapters/02) > 譯者:[飛龍](https://github.com/wizardforcel) > 協議:[CC BY-NC-SA 4.0](http://creativecommons.org/licenses/by-nc-sa/4.0/) > 自豪地采用[谷歌翻譯](https://translate.google.cn/) “這些問題已經,而且可能永遠留在自然界難以捉摸的秘密之中,它們屬于人類智力根本難以接近的一類問題。 - 1849 年 9 月,倫敦時報,霍亂如何傳染和傳播 死刑有威懾作用嗎?巧克力對你有好處嗎?什么導致乳腺癌? 所有這些問題試圖為結果找到一個原因。仔細檢查數據可以幫助揭示這些問題。在本節中,你將學習建立因果關系所涉及的一些基本概念。 觀察是良好科學的關鍵。觀察研究是一項研究,科學家根據他們所觀察到的,但卻無法產生的數據作出結論。在數據科學中,許多這樣的研究涉及對一組個體的觀察,稱為實驗的利害關系(factor of interest),以及對每個個體的測量結果。 將個體視為人是最容易的。在研究巧克力是否對健康有好處時,個體確實是人,實驗是吃巧克力,結果可能是血壓的測量。但觀察研究中的個體不一定是人。在研究死刑是否具有威懾作用時,個體可以為聯盟的 50 個州。允許死刑的州的法律是實驗,結果可能是州的謀殺率。 根本問題是實驗是否對結果有影響。實驗和結果之間的任何關系被稱為關聯。如果實驗導致結果發生,那么這個關聯是因果關系。因果關系是本節開頭提出的所有三個問題的核心。例如,問題之一是巧克力是否直接導致健康狀況的改善,而不是巧克力與健康之間是否存在關聯。 因果關系的建立往往分兩個階段進行。首先,觀察一個關聯。接下來,更仔細的分析決定了因果關系。 ## John Snow 和 Broad 街水泵 ### 觀察和可視化:John Snow 和 Broad 街水泵 精確觀察導致建立因果關系的例子之一,最早可以追溯到 150 多年前。為了將你的思維帶回正確的時間,試著想象一下 19 世紀 50 年代的倫敦。這是世界上最富裕的城市,但其中許多人卻極度貧困。那時,查爾斯·狄更斯(Charles Dickens)在名氣鼎盛時,正在寫作關于他們的困境的文章。這個城市的貧困地區疾病盛行,霍亂是最可怕的。那個時候還不知道細菌會導致疾病,主流理論是“瘴氣”是主要的罪魁禍首。 瘴氣表現為惡臭,被認為是由腐爛物質引起的無形的有毒顆粒。倫敦的部分地區氣味非常糟糕,特別是在炎熱的天氣里。為了保護自己免受感染,那些有能力的人把甜的東西放在鼻子上。 幾年來,一個名叫約翰·斯諾(John Snow)的醫生一直在跟蹤著時不時襲擊英國的巨大霍亂。疾病突然到來,幾乎立即致命:人們在一兩天內死亡,數百人在一個星期內死亡,單批總死亡人數可能達到數萬人。斯諾對瘴氣理論持懷疑態度。他注意到,當整個家庭被霍亂摧毀時,鄰居有時完全沒有受到影響。當他們呼吸和鄰居一樣的空氣和瘴氣時,不好的氣味和霍亂的發生之間沒有什么緊密的聯系。 斯諾還注意到,這種疾病的發作幾乎總是牽涉嘔吐和腹瀉。因此,他認為這種感染是由人們吃或喝的東西來進行的,而不是他們所呼吸的空氣。他主要懷疑被污染的水。 1854 年 8 月底,霍亂在過度擁擠的倫敦蘇豪區爆發。隨著死亡人數的增加,斯諾用一種在疾病傳播研究中成為標準的方法,勤奮地將它們記錄下來:他畫了一張地圖。在該地區的街道地圖上,他記錄了每次死亡的地點。 這是斯諾的原始地圖。每個黑色條形代表一次死亡。黑色圓圈標記了水泵的位置。地圖上顯示了一個驚人的啟示 - 死亡大致集中在 Broad 街水泵周圍。 ![](https://box.kancloud.cn/66ecc1a6d9d5e09c07d0e8467f8e79c6_566x516.jpg) 斯諾仔細研究了他的地圖,并調查了明顯的異常。他們都設計 Broad 街水泵。例如: + 死亡發生在離 Rupert 街水泵更近的房子,而不是 Broad 街。盡管 Rupert 街水泵直線上更近,但由于街道布局不方便,是死路一條。那些房子里的居民使用了 Broad 街水泵。 + 泵東邊的兩個街區沒有死亡。那是 Lion Brewery 的位置,那里的工人喝了他們釀造的東西。如果他們想喝水,啤酒廠有自己的井。 + Broad 街水泵幾個街區之外的房子里,發生了少量死亡。那些孩子在上學路上從 Broad 街水泵飲水。泵的水清涼爽口。 最后一個支持斯諾的理論的證據是,在距離 Soho 區很遠的 Hampstead 地區的兩個孤立的死亡事件。斯諾對這些人感到困惑,直到他得知死者是住在 Broad 街的 Susannah Eley 夫人和她的侄女。Eley 夫人每天都將 Broad 街水泵的水帶到 Hampstead 給她。她喜歡水的味道。 后來發現了一個糞坑,距離 Broad 街水泵幾英尺遠,滲入了井里面。因此,來自霍亂受害者房子的污水污染了水泵的水。 斯諾用他的地圖來說服當地政府,拆除 Broad 街水泵的手柄。雖然霍亂疫情已經在減少,但是停止使用這種水泵有可能阻止了許多人死于未來的疾病。 Broad 街水泵的手柄的拆除已成為一個傳奇。在亞特蘭大的疾病控制中心(CDC),當科學家尋找流行病問題的簡單答案時,他們有時會互相問:“這個水泵的手柄在哪里?” 斯諾的地圖是數據可視化的最早和最強大的用法之一。現在各種疾病地圖是跟蹤流行病的標準工具。 ### 因果關系 雖然地圖給了斯諾強有力的證據,說明了供水的清潔是控制霍亂的關鍵,但是,為了使“污染的水導致疾病的傳播”這個科學論證有說服力,還有很長一段路要走。為了使案例更有說服力,他必須使用比較法。 科學家使用比較來確定實驗與結果之間的關聯。他們比較了一組接受實驗的個體(實驗組)的結果,和一組沒有接受實驗的個體的結果(對照組)。例如,現在的研究人員可能會比較死刑國家和沒有死刑的國家的平均謀殺率。 如果結果不同,那就是表明關聯的證據。但是為了確定因果關系,需要更加小心。 ## 斯諾的“大實驗” 斯諾為自己在 Soho 中學到的東西感到鼓舞,他對霍亂的死亡情況做了更徹底的分析。一段時間中,他一直在收集倫敦一個地區的數據,這里由兩家水廠服務。Lambeth 水廠從污水排入泰晤士河的地方的上游抽水。它的水比較干凈。但 Southwark and Vauxhall (S&V) 公司在污水排放的下游抽水,因此其供水受到污染。 下圖顯示了兩家公司所服務的地區。斯諾專注于兩個服務地區重疊的地方。 ![](https://box.kancloud.cn/5dc40f63c74871d1915c270dcbc93b87_566x446.jpg) 斯諾注意到,S&V 供應的人和 Lambeth 供應的人之間沒有系統的差別。 “每家公司都供應富人和窮人,大房子和小房子,接受不同公司的供水的人的狀況或職業并沒有差別......接受兩家公司供水的人或者房子都沒什么區別,它們周圍的物理狀況也沒什么區別...” 唯一的區別是供水方面,“一組供水含有倫敦的污水,其中有一些可能來自霍亂病人,另一組則不含。” 斯諾相信他能夠得出一個清楚的結論,斯諾在下表中總結了他的數據。 | Supply Area | Number of houses | cholera deaths | deaths per 10,000 houses | | --- | --- | --- | --- | | S&V | 40,046 | 1,263 | 315 | | Lambeth | 26,107 | 98 | 37 | | Rest of London | 256,423 | 1,422 | 59 | 數字在指責 S&V。 S&V 供應的房屋的霍亂死亡率幾乎是 Lambeth 供應的房屋的十倍。 ## 建立因果 用本節前面提出的語言,可以將 S&V 房屋中的人作為實驗組,Lambeth 房屋中的人作為對照組。斯諾的分析中的一個關鍵因素是,除了實驗組以外,兩組相互比較。 為了確定供水是否引起霍亂,斯諾必須比較兩個彼此相似的群體,它們只有一方面不同:供水。只有這樣,他才能夠將其結果的差異歸因于供水。如果這兩個群體在其他方面有所不同,那么就很難把供水視為疾病的來源。例如,如果實驗組由工廠工人組成,而對照組不是,那么兩組之間的結果之間的差異可能是由于供水,工廠工作或兩者兼有,或使兩組彼此不同的其它因素。最后的圖景會更加模糊。 斯諾的才智在于,確定可以使他的比較清晰的兩組。他開始著手建立水污染和霍亂感染之間的因果關系,并且在很大程度上他成功了,盡管瘴氣學說忽視甚至嘲笑他。當然,斯諾并不了解人類感染霍亂的詳細機制。這個發現是在 1883 年,當時德國科學家羅伯特·科赫(Robert Koch)分離出霍亂弧菌,這種霍亂弧菌是進入人體小腸并引起霍亂的細菌。 事實上,霍亂弧菌在 1854 年由意大利的菲利波·帕齊尼(Filippo Pacini)發現,就在斯諾在倫敦分析他的數據的時候。由于意大利瘴氣學說的統治,帕齊尼的發現并不為人所知。但到了十九世紀末,瘴氣學說正在消失。隨后的歷史證明了帕齊尼和約翰·斯諾。斯諾的方法導致了流行病學領域的發展,它是疾病傳播的研究。 ### 混淆 現在讓我們回到更現代化的時代,帶著我們一路上學到的重要經驗: 在一項觀察研究中,如果實驗組和對照組在實驗以外的方面有所不同,則很難對因果關系作出結論。 兩組之間的根本區別(除了實驗)被稱為混淆因素,因為當你試圖得出結論時,它可能會混淆你(也就是搞砸你)。 示例:咖啡和肺癌。二十世紀六十年代的研究表明,喝咖啡的人患肺癌的比率高于不喝咖啡的人。因此,有些人認為咖啡是肺癌的一個原因。但咖啡不會導致肺癌。分析包含一個混淆因素 - 吸煙。在那些日子里,喝咖啡的人也可能是吸煙者,吸煙確實會導致肺癌。喝咖啡與肺癌有關,但不會導致疾病。 混淆因素在觀察研究中很常見。良好的研究需要非常小心,以減少混淆。 ## 隨機化 避免混淆的一個很好的方法是,將個體隨機分配到實驗和對照組,然后將實驗給予分配到實驗組的人。隨機化使兩組除了實驗之外都相似。 如果你能夠將個體隨機分為實驗組和對照組,你正在進行一項隨機對照試驗(RCT)。有時候,人們在實驗中的反應會受到他們知道他們在哪個群體的影響。所以你可能希望進行盲法實驗,其中個體不知道他們是在實驗組還是對照組。為了使它有效,你必須把安慰劑給控制組,這是一種和實驗看起來完全一樣的東西,但實際上沒有效果。 隨機對照實驗早已成為醫學領域的黃金標準,例如確定新藥是否有效。在經濟學等其他領域也越來越普遍。 示例:墨西哥的福利補貼。在 20 世紀 90 年代的墨西哥村莊,貧困家庭的孩子往往沒有入學。其中一個原因是年齡較大的孩子可以上班,從而幫助家庭。墨西哥財政部長 Santiago Levy 著手調查福利項目是否可以用來提升入學率和改善健康狀況。他在一組村莊進行了一項隨機對照試驗,隨機選擇其中的一些來接受一個名為 PROGRESA 的新福利項目。如果他們的孩子定期上學,并且家庭使用了預防性醫療保險,那么這個項目會把錢捐給貧困家庭。如果孩子上中學而不是小學,會給他們更多錢,來補償孩子的工資損失,女孩上學比男孩給的更多。其余的村莊沒有得到這個實驗,并形成了對照組。由于隨機化,沒有銷魂因素,可以確定 PROGRESA 增加了入學率。對于男孩,入學率從對照組的 73% 上升到 PROGRESA 組的 77%。對于女孩來說,增長幅度更大,從對照組的 67% 增加到 PROGRESA 組的近75%。由于這個實驗的成功,墨西哥政府以 OPORTUNIDADES 這個新名稱支持這個項目,作為對一個健康和受過良好教育的人口的投資。 在某些情況下,即使目標是調查因果關系,也不可能進行隨機對照實驗。例如,假設你想研究懷孕期間飲酒的影響,你隨機將一些孕婦分配到你的“酒精”組。如果你給他們喝一杯,你不應該期待她們會合作。在這種情況下,你幾乎總是在進行觀察研究,而不是實驗。要警惕混淆因素。 ## 尾注 根據我們開發的術語,約翰·斯諾進行了一項觀察研究,而不是一個隨機的實驗。但是他把自己的研究稱為“大實驗”,因為他寫道:“至少三十萬人......被分成兩組,他們無法選擇,在大多數情況下,他們并不知情......” 斯諾的這種研究有時被稱為“自然實驗”。然而,真正的隨機化并不僅僅意味著,實驗和對照組“在他們無法選擇的情況下”進行選擇。 隨機化的方法可以像擲硬幣一樣簡單。它也可能更復雜一點。但是隨機化的每一種方法都是由一系列精心定義的步驟組成的,這些步驟允許幾率以數學方式指定。這有兩個重要的結果。 + 它使我們能夠以數學方式,計算隨機化產生實驗和對照組的可能性。 + 它使我們能夠對實驗組和對照組之間的差異作出精確的數學表述。這反過來幫助我們對實驗是否有效作出正確的結論。 在本課程中,你將學習如何進行和分析你自己的隨機實驗。這將涉及比本節更多的細節。目前,只需關注主要思想:嘗試建立因果關系,如果可能,進行隨機對照實驗。如果你正在進行一項觀察研究,你可能能夠建立聯系而不是因果關系。在根據觀察研究得出因果關系的結論之前,要非常小心混淆因素。 ### 術語 + observational study:觀察研究 + treatment:實驗 + outcome:結果 + association:關聯/聯系 + causal association:因果聯系 + causality:因果(關系) + comparison:比較 + treatment group:實驗組 + control group:對照組 + epidemiology:流行病學/傳染病學 + confounding:混淆 + randomization:隨機化 + randomized controlled experiment:隨機對照實驗 + randomized controlled trial (RCT):隨機對照實驗 + blind:盲法 + placebo:安慰劑 ### 有趣的事實 + 約翰·斯諾有時被稱為流行病學之父,但他是專業的麻醉師。 他的病人之一是維多利亞女王,她是分娩時麻醉劑的早期接受者。 + 弗洛倫斯·南丁格爾,現代護理實踐的創始人,因其在克里米亞戰爭中的工作而聞名,是一位頑固瘴氣主義者。 她沒有時間研究傳染病和細菌的理論,也沒有時間講述她的話。 她說:“與這個學說相關的荒謬是無窮無盡的。一言以蔽之,從一般意義上說,沒有任何科學研究可以接受的證據表明,存在傳染病這樣的事情。” + 后來的隨機對照試驗表明,PROGRESA 堅持的條件 - 孩子上學,預防性醫療保險 - 對于提升入學率沒有必要。 只是提高福利金就足夠了。 ### 擴展閱讀 + [The Strange Case of the Broad Street Pump: John Snow and the Mystery of Cholera](http://www.ucpress.edu/book.php?isbn=9780520250499) 由 Sandra Hempel 所著,加利福尼亞大學出版社出版,讀起來像是偵探小說。 這是本節中約翰·斯諾和他的工作的主要來源之一。 一些警告:這本書的一些內容令人反胃。 + [Poor Economics](http://www.pooreconomics.com/) 由 MIT 的 Abhijit V. Banerjee 和 Esther Duflo 所著的暢銷書,是對抗全球貧困的方式的易理解的真實記錄。 它包含了很多 RCT 的例子,包括本節中的 PROGRESA 示例。
                  <ruby id="bdb3f"></ruby>

                  <p id="bdb3f"><cite id="bdb3f"></cite></p>

                    <p id="bdb3f"><cite id="bdb3f"><th id="bdb3f"></th></cite></p><p id="bdb3f"></p>
                      <p id="bdb3f"><cite id="bdb3f"></cite></p>

                        <pre id="bdb3f"></pre>
                        <pre id="bdb3f"><del id="bdb3f"><thead id="bdb3f"></thead></del></pre>

                        <ruby id="bdb3f"><mark id="bdb3f"></mark></ruby><ruby id="bdb3f"></ruby>
                        <pre id="bdb3f"><pre id="bdb3f"><mark id="bdb3f"></mark></pre></pre><output id="bdb3f"></output><p id="bdb3f"></p><p id="bdb3f"></p>

                        <pre id="bdb3f"><del id="bdb3f"><progress id="bdb3f"></progress></del></pre>

                              <ruby id="bdb3f"></ruby>

                              哎呀哎呀视频在线观看