先看兩個書中提到的例子。
蒙提·霍爾悖論
美國壹檔有名的電視節目《讓我們做個交易》,由蒙提·霍爾主持。節目的最後壹關,有機會獲得大獎的選手和蒙提·霍爾站在三扇巨大的門前面。其中壹扇門的後面擺放著大獎轎車,而其余兩扇門後各站著壹頭山羊。選手需要在這三扇門中選擇壹扇門,得到門後的獎品。
中大獎的概率壹目了然,選手有1/3的概率能選中後面放著轎車的那扇門。但是這個節目的微妙之處在於,主持人蒙提·霍爾事先知道每扇門後是什麽,當選手選中壹扇門之後,蒙提·霍爾並不會馬上揭曉答案,而是會打開剩下未被選中的兩扇門中的壹扇,這扇門的後面壹定是壹頭山羊。蒙提·霍爾會詢問選手,是否更改之前的決定,也就是可以在剛才選擇的那扇門和剩下的那扇門中再選擇壹次。這時,這兩扇門依舊緊閉著,選手唯壹得到的新信息是,在自己剛才沒有選擇的那兩扇門中,有壹扇門後面是壹頭山羊。
選手應該改變最初的選擇嗎?答案是肯定的,因為改變之後,中獎概率由1/3變為2/3。原因後面解釋。
檢測為陽性的患病概率
假設某種罕見疾病的患病率為0.001%,即10萬分之壹。假設檢測過程中不會產生壹例偽陰性(也就是患病者絕不會被誤檢為正常),但產生偽陽性(即沒有患此病的人會被誤檢為陽性)的概率為萬分之壹。這個檢測準確率已經非常高了,但結果是,絕大部分被診斷為陽性(也就是患有此病)的人實際上根本沒有得此病。這又是為什麽呢?
書中假設對美國1.75億成年人進行篩查檢測。那麽,按照0.001%的患病概率和百分之百的陽性檢測正確率(不會有壹例被誤檢為陰性),將會有1750人確實患有疾病且檢測為陽性。而在剩下的99.999%的健康人中,將會有萬分之壹的人(0.01%)被誤診為陽性,即1.75億×99.999%×0.01%,約為17500人。由此可以看出,篩查檢測中總***有19250人的檢測結果為陽性,但真正患病的只有9%。這還是壹個準確性非常高、偽陽性非常低的檢測。
類似在現實生活中有趣的例子和應用在書中還提到很多,如視頻網站如何推薦和妳胃口的影片,為什麽購買保險是壹項“糟糕的投資”,排名靠前的學校就更好嗎,怎樣在地下停車場快速找到商城入口,籃球運動員投籃的“手感”其實是不存在的……這些例子可以作為辨識和駁斥朋友圈裏那些無腦必轉和秀智商下限的反智文章的有力武器。
這本書通過這些生動的案例,深入淺出地介紹了概率期望和大數定律、相關性和相關系數、正態分布、標準差和中心極限定理、平均數和中位數、回歸分析最小二乘法、中心極限定理等。提出了壹些常見的誤區,如賭徒謬論、幸存者偏差、選擇性偏見、相互獨立事件的濫用誤區……
可能有人認為這書太淺顯了,很多精深的理論和方法沒有講透。其實這正是作者的高明之處,通過淺顯的案例和語言,在輕松愉快的氛圍下,讓初學者能夠有醍醐灌頂之感,數學並不像壹般人認為的那樣恐怖,並不需要掌握多少高深的數學理論,就可以成為我們生活中的好幫手、好工具。
提煉10條書中的觀點:
如今,概率統計比以往任何時候都更加重要,因為我們現在有了更多機會來充分利用數據並從中獲取有意義的信息。統計學並不會告訴我們怎樣使用數據是合適的,它可能讓我們的生活變得更好,但濫用也會造成嚴重的後果。 所以再重復壹次:數學並不能代替判斷。 數學有助於做出判斷,但判斷比數學更重要。
回到開頭蒙提·霍爾悖論的例子。可能有的人會認為,兩扇門中獎概率都壹樣啊,壹扇門後是轎車、壹扇門後是羊,都是1/2,或者都是1/3,改不改沒什麽不同,不如堅持初心。為什麽另壹扇門的概率由1/3變為2/3了呢?
其實這時候的另壹扇門,並不僅僅代表那壹扇門,而是選手之前未選擇的那兩扇門。我們清楚,主持人是知道每壹扇門背後的獎品是什麽的。那麽可以這樣想,壹開始選手選了壹扇門比如a,這時主持人問選手換不換成另兩扇門b和c。車有可能在a門後,也可能在b或c門後。不換,1/3,換,2/3。不管選手選擇換不換,主持人都會在b和c中間打開那扇沒有車的門。主持人打不打開其中壹扇門,其實對選擇的概率是沒有影響的。
如果妳不相信或仍未看懂,書中用了3種不同的方法來證明這壹選擇的正確性,可以再去深入了解下。如果妳要說,我就是認定之前的那扇門後是大獎,堅決不換,那也沒辦法,因為這裏只是從概率上進行分析。換了之後中獎的概率比不換要大,但並不保證壹定中大獎。不能因為有人選擇不換但中了大獎,而去質疑選擇換的合理性,那就陷入了幸存者偏差的誤區了。