-
《統計數字會撒謊》[12句]
達萊爾·哈夫《統計數字會撒謊》一書是由美國統計專家達萊爾·哈夫寫就的傳世之作,該書引發的“編造虛假信息”話題受到美國社會持續普遍的關註和美國權威媒體的激烈爭論。它自50年代出版以來就不斷一版再版,並被翻譯成多種文字,在世界的影響力持久不衰,被譽為美國商業人士、研修人員的重要入門必修書之一。
“自從使用了某某牌牙膏,我們的蛀牙減少了23%”;
“1924級的耶魯畢業生平均年收入是25111美元”;
真相果真如此?數字的魔力決不僅止於此!
“根據相同的收入取樣,計算方法也完全正確,同一個小區居民的年平均收入可以是2000英鎊,也能是10000英鎊”;
只需施展一點小技巧,就能讓數據麵目全非!
你是否執著於打聽智力測驗的結果? 你是否對電視上那些專家所言的各種標準堅信不疑?
你是否認為抽煙與成績的好壞直接相關?抑或受高等教育與晚婚有必然聯系?
你是否確信眼見為實?如果圖形能讓事實的1:2瞬間變為眼前的1:8呢?你還確信自己的感覺嗎?
這本“故事書”般的經典之作將為您輕松揭開謎底……
作為揭露數據造假經典工具書,達萊爾·哈夫這本《統計數字會撒謊》在50年代一出版,就成為有些人的“心頭大患”,他們在全世界對其進行圍追堵截,因為他們相當害怕讀者看到書中的真相。它誕生之後,不僅被奉為“世界統計學普及讀物第一暢銷書”、“25本投資經典之一”、“經典社會學讀本”,而且被譽為“數據造假曝光寶典”,在世界暢銷50年而不衰。達萊爾·哈夫用風趣的插圖和通俗的語言把高深的統計寫得像“故事書”一樣精彩,這種獨具一格的行文和編排使得此書更具魅力。此外,書中還給你揭露了大量至今仍被銷售員、專家、記者或者廣告撰稿人頻頻使用的“行騙工具”:有偏的樣本,可以挑選的平均數,遺漏某些重要的數據,混淆因果關系,濫用一維圖形等。更為重要的是,達萊爾·哈夫在書中破解了如何識破虛假統計數據。
當你麵對虛假但貌似真實的統計數據時,誰說的?他是如何知道的?遺漏了什麼?是否有人偷換了概念?這個資料有意義麼?
上辑:
《慎齋遺書》[5句]
下辑:
《我有個戀愛想和你談下》[9句]
- 在處理諸如人類特征的數據時,各種平均數的數值十分接近。這些數據具有我們常說的正態分布的形態特點,在你用曲線繪制正態分布時,將看到一根鐘形的曲線,均值、中位數和眾數都落在相同的點上。 0 0 0
- 所以,當你被告知某個數是平均數時,除非能說出它的具體種類--均值,中位數,還是眾數,否則你對它的具體涵義仍知之甚少。 0 0 0
- 事實往往在所見所聞之外。平均數、作用關系、趨勢和圖表總是與看上去的不一致。雖然經驗告訴我們"眼見為實",但眼睛告訴我們的"真相"或許隱瞞了部分事實,或許誇大了事實。 0 0 0
- 我們可以定量地衡量你的樣本能以多大的精度代表總體,那就是:可能誤差和標準誤差。 0 0 0
- 多少才算夠呢?這又是個棘手的問題。它取決於其他的因素,即你采用抽樣方式所研究的總體容量有多大、變動程度有多大。值得一提的是,有時樣本的規模與看上去的並不一致。 0 0 0
- 有一個裝著紅、白兩色豆子的桶,如果你想要準確知道這個桶中兩種豆子的數量,你惟一能做的只有一顆一顆地數豆子。 用一種更簡單的方法也可以揣測紅豆的數量:抓一把豆子,假定手中紅豆的比例與桶中紅豆的比例相同,只要數一數手中的豆子即可。如果你的樣本足夠大,並且選擇方法正確,在大多數情況下它能夠很好地代表整體。但是,如果以上兩個條件不滿足,這樣的樣本比一個臆想好不到哪兒去,除了能夠營造科學精確的假象之外,其他則根本不值一提。不幸的是,我們所看到的,或者我們自以為了解的許多事物,往往都是根據類似樣本所得出的結論,這種樣本可能變得有偏,由於選擇方式的不合理或者容量過小,抑或兩種情況同時存在。 0 0 0
- 一般而言,民意調查都帶有一定方向的誤差。就像前文所舉《文學文摘》例子的偏差一樣,如果對此表示懷疑,你還可以找到許多恰當的例子來證明。在《文學文摘》的例子中,與希望代表的全體選民相比,由於偏向了比平均選民收入更高、受過更多教育、信息面更廣、反應更快、舉止優雅、行為保守、更多固定習慣等特點的群體,而產生了誤差。 0 0 0
- 無形的誤差與有形的誤差一樣容易破壞樣本的可信度。也就是說,即使你找不到任何破壞性的誤差來源,但只要有產生誤差的可能性,你就有必要對結果保留一定的懷疑。 0 0 0
- 一位心理醫生曾經寫道:實際上每個人都有點神經質。暫且不去管這種提法是否破壞了"神經質"一詞的含義,我們來看看這個醫生的樣本,也就是說,他觀察了哪些人才得到了上述結論?事實上,他是在對他的病人進行研究後才得到了這個發人深省的結論,這和代表全體人的樣本可差的是十萬八千裏。想想看,如果一個人心理健全,他是永遠都不會接受心理醫生的治療的。 0 0 0
- 我們試著來解釋這個數字,單憑常識就知道這個數字與現實出入很大。現在,讓我們找找最大誤差的可能來源。是什麼使那些實際上收入也許只有25111美元一半的人們最終會擁有如此豐厚的平均收入?讓我們來揭開這神秘的麵紗。 可以肯定的是:耶魯畢業生的報道基於對某個樣本的分析,因為常識告訴我們,沒有人能夠掌握所有仍在世的1924級學生的情況,25年後,他們中的許多人已經消失在茫茫人海中。 0 0 0
- 統計這種神秘的語言,在一個靠事實說話的社會裏是如此地吸引眼球,但有時它卻被人利用,並成為惡意誇大或簡化事實、迷惑他人的工具。在報告社會經濟趨勢、商業狀況、民意調查和普查的大量數據時,統計方法或者統計術語是必不可少的。但如果作者不能正確理解並恰當地使用這些統計語言,而讀者又並不能真正了解這些術語的含義,那麼,統計結果只能是廢話一堆。 0 0 0
- 隨機樣本的檢驗方法是:總體中的每個名字或每個事物是否具有相同的幾率被選進樣本? 純隨機樣本是惟一有足夠把握經受統計理論審查的樣本。但它也有不足之處,在很多情況下,獲得這種樣本的難度很大並且十分昂貴,以至於單純考慮成本就會排除它。分層隨機抽樣是一個更經濟的替代品,目前在民意調查和市場研究等領域中得到了廣泛的應用。 0 0 0