• <li id="ccaac"></li>
  • <table id="ccaac"><rt id="ccaac"></rt></table>
  • <td id="ccaac"></td>
  • <td id="ccaac"></td>
  • 做一次生活科學家

    上一篇 / 下一篇  2009-09-12 14:50:23/ 個人分類:生活

    曾經,謊話要用甜言蜜語做包裝,加上小恩小惠的糖衣,添一點楚楚可憐的好味道,就能讓人神魂顛倒。結果,我們這些生存競爭之下的幸存者多少喪失了天 真,不會被單純的漂亮話弄迷惑。先不要得意,現在,似是而非的“科學結論”、復雜的統計數據,開始出現在了從特效療法到金融產品上,沒有點專業知識,我們 似乎又要被忽悠了。別急,學一點科學方法,可以幫我們理清真相。


    salesman

     

    實驗,厘清混淆的變量

    一位保健品推銷員正在這么向你介紹他的產品:“這補腦劑效果可好了,我兒子吃了一個月,學習成績明顯提高了。”好吧,作為一個久經沙場的消費者,你 根本不信。推銷員可能會有一個兒子,可學習成績有沒提高就未必了,更有可能的是,他兒子根本不吃這種東西。你心里暗想,在拿自家人舉例方面,推銷員和相聲 演員有一拼啊。可現在,推銷員改變了戰術:“我們的研究表明,在吃了我們的保健品半年后,學生的記憶力顯著提高。”那么,信,還是不信呢?

    我們首先假設,推銷員不會偽造數據,說的都是有據可查。這樣能否證明他的保健品就真的有效呢?如果問一個受過科學訓練的人,他會告訴你,不一定。在 這個例子里,學生的記憶力可能受很多個因素的影響。比如,兒童的記憶力在小學階段是逐步提高的,即使什么都不做,三年級學生的記性也比一年級好;在這半年 里,老師的教育也在幫助學生學習識記;當然,保健品也許真的有效。

    一個科學家要想檢驗這個假設——“服用該保健品一段時間可以提高學生記憶力”,該如何做呢?答案是:控制變量。

    我們關心的數據可能受許多因素的影響,所謂控制變量,指的就是把額外的因素控制住,使它們盡量少地影響數據,從而讓我們能集中觀察需要研究的因素產 生了什么影響。比如,針對這種保健品,科學家不會簡單說有效還是無效,而是要進行實驗,把年齡、教學方法之類額外的因素影響去除,單獨針對保健品來檢驗。 他會選取一個班級,先測試一下孩子的記憶力,然后把孩子隨機分成兩半,一半服用保健品,一半服用相同量的面粉壓成的藥片,即安慰劑。三個月或半年半年以后 回來再次測試,看看兩組的成績有沒有差異。

    為什么要搞得這么麻煩?讓我來解釋一下。把學生分成兩組,一組實驗組,一組對比組,為的是保證除了服用保健品之外,兩組的其他情況盡可能一樣。同一 個班級,避免了因為年齡差異、教學方法不同等因素造成的學生記憶力的差別;隨機分配,使兩組間的記憶力平均成績在沒有服藥前基本一致。最后,他還會給沒有 服藥的孩子開安慰劑。這些面粉片里根本不含任何影響記憶力的成分,卻會導致人們心理狀態的變化。我們也不知道服藥后感覺記憶力提高是不是只是一種心理作 用,因此只有使用安慰劑來平衡兩組在這方面受到的影響。如果實驗結束后,學生們的記憶力確實比半年前有所提高,可兩組之間沒有差異,我們就知道,這提高并 非來自保健品的功效了。

    把準實驗偽裝成實驗,已經足夠令人困擾了,而另一個煙霧彈則是統計數據。還是以上面的例子,記憶力“顯著提高”是什么意思呢?是以前每天能背記十個 單詞,現在提高到了二十個了呢?還是從一百個提到了一百一十個?這兩者都是每天提高十個,但難度卻不可同日而語。在表述上,前者可以說成記憶力提高百分之 百,而后者卻只是提高百分之十。

    相關,廣受誤解的概念

    統計學誕生之初,作用之一就是提供各種數據以供參考。許多隱藏在混亂數據 下的現象被它揭示了出來;許多含混的說法也得以澄清。但與此同時,新的麻煩也隨之而來。媒體很早就學會了使用統計數據這一招,渾水摸魚者當然也不甘落后。 理解統計數據多少需要一點專業知識,而呈現清晰的數據恐怕還需要一點良心。于是可以想象,貌似科學的數據成了騙子的新法寶。

    早在1954年,美國記者達萊爾·哈夫就寫了一本《統計陷阱》,專門談使用統計學撒謊的種種伎倆。將相關說成因果,就是其中一種利用統計的謊言。

    事物之間的關系多種多樣,統計上關心的兩種關系是因果和相關。前者不難理解,比如說缺水導致歉收;后者對大眾卻有點生疏,它指的是兩者有著相同和相 異的變化趨勢。相同的趨勢叫做正相關,比如一組孩子的身高和體重往往是正相關的,身高越高體重相應越重;相異的則是負相關,比如吃高脂肪食物越多,保持健 康的幾率越小。請記住,這些關系并不是因果關系,我們還不能確定其中一個變量的變化導致了另一個變量的變化。很有可能存在另一個變量影響了它們兩個。比 如,生長發育導致了身高體重的增長,又興許存在肥胖基因,才是暴食和血管疾病的罪魁禍首。

    然而,將相關當作因果確實屢見不鮮。某調查顯示,常去網吧和學習成績低下呈高度正相關,就是說學生去網吧越頻繁,學習成績越差。這不免讓人推論,去 網吧使成績變差,但事實情況可能并不存在這種因果關系,而是厭學情緒或者學習障礙導致了學生成績差和喜歡去網吧。在這個例子中,去網吧的頻率和學習成績可 能都受厭學情緒的影響。學生厭學情緒越強烈,去網吧越頻繁,同時學習成績越差。但如果我們不作進一步研究,就可能僅僅把相關的兩者看作因果,從而將學習不 好完全歸因于網吧。而禁止學生去網吧,起到的作用很可能十分有限。

    一個收費昂貴的訓練班宣稱,他們的學員在畢業后三年都獲得了極高的收入。我們是否該馬上報名參加,好早一點學會這致富經呢?且慢,我們仔細檢查這些 數據,興許會發現這么一個悚然一驚的事實——這些學員在入學前已有一定的經濟基礎,正因為如此他們才擔負得起高昂的學費,則他們增長的收入很大程度上來自 于已有的基礎。如果你本來不富有,恐怕訓練班也不能教會你什么讓你變得有錢。

    另一個相關研究這樣宣布:收入和智商呈現正相關。不用懷疑,在某些情況下這很可能是真的。我們知道,孩子的智力發展和家庭教養環境高度相關,那些家 境良好的孩子往往能接受很好的醫療和早期教育。出身良好往往確實意味著擁有高智商的機會增加了。但這個例子并非說高收入導致了高智商,而是提醒我們,亟需 幫助那些家境不好的孩子獲得良好的教育。

    這些例子告訴我們,輕易歸因是隱患重重的。世界上有聯系的事物甚多,但確定因果關系卻需慎而又慎。

    3352295863_3633042c37

    抽樣,你的數據代表誰?

    最常見的統計數字誤導恐怕就是來自抽樣的問題了。試想這么一個問題:中國成年男性的平均身高是多少?按照平均數的計算方法,我們應該測量所有成年男 性,然后將身高加在一起再除以人數,這顯然是不可能的。可是,我們設計家居時,人類工效學的工程師卻告訴你,這個數字是170厘米。這是怎么得出的呢?

    要計算這個數字就需要進行抽樣。從所有成年男性中抽出一個樣本,計算樣本的平均身高,以這個數值作為中國所有男性平均身高的估計。只要樣本選取得當,這個估計值就非常可信。

    如何才能算作得當?首先是需要樣本足夠大,盡可能減少隨機誤差帶來的干擾。這個“大”在不同的情況下是很不一樣的。如果我們研究的是一所學校,可能 選取一到兩個班就可以了。可如果涉及的問題是全國性質的,可能人數就要達到數千、數萬甚至更大。樣本容量有保證是一方面,另一方面是樣本選取不能有偏,就 是樣本能很好的代表總體。

    我們知道,中國各地的人身材是有一定差異的,如果僅僅選取某些地區進行測量,就可能得出一個和真實情況差別很大的結果。最后,還有一點,很多調查受到社會贊許傾向的影響,例如,恐怕很少有人愿意填寫問卷承認自己歧視農民工,但實際言行顯然是另一回事。

    看到這里,讀者可能已經想到了網上常見的所謂民意調查。且不論是否可能造假制造所謂“民意”,這些結果是否能夠采信都值得存疑,其原因就在于樣本構成大有問題。

    某網站將調查放出,最可能看到這個調查的是這個網站的常客,而他們參加調查的動機各有不同。某些話題更能引發人的興趣,有些則只是很少的人關心。這 都會導致最終參加調查的人是一個有偏的樣本。結論可能代表了這些人群,卻不能推廣到全體。不妨試試,在高檔消費網站投放一個增加稅收以補助農村醫療的調 查,看一看能回收哪些意見。

    如果我們現在做一個調查,看一看最初恢復高考的三年中幾所名牌大學入學學生如今的年收入,你一定會得到一個高得嚇人的數字。我敢如此肯定并不是我熟 悉他們的社會成就,而是因為我了解調查的缺陷。可以想見,當年的那些大學生雖然有案可查,但能夠準確聯系調查的卻只有一部分較為成功的人了。其中有一些人 雖然聯系上了,卻不一定愿意接受調查。最后,還不能排除一些人受贊許傾向的影響,有意無意地提高報告自己的收入水平。最終,調查員只回收了那些成功人士的 數據,而沉默的大多數卻被“統計式”地忽視了。

    還不得不考慮,平均數也有一個小小的麻煩,它特別容易受極端數據的影響。回憶一下小學時老師對一個差生拉下全班平均分的憤懣表情。以及,一個月收入五萬的老板和五名月收入兩千元的員工享受著一萬元的月平均工資,而這個平均數居然是一個員工月收入的五倍之多。

    結語,科學方法,現代公民的必修課

    只要伎倆足夠精巧,學習過統計學的人都有可能被暫時蒙蔽。還記得講到實驗時所說的保健品吧?保健品公司宣稱,在所有考試成績優異的學生中,有68% 服用了他們的產品。我們就要問問,這些接受調查的學生是怎么樣選取的呢?為什么不調查在所有服用產品的學生中,有多少感到成績提高?而公司又可以宣稱,他 們發現,保健品使用量與學生的英語成績正相關。好吧,他們沒告訴你的是,他們調查了30個學生,其中只有5個人吃了保健品,從將及格到中等成績,確實是吃 得多成績好一點。更不用提當這些結果登載在報上時,精明的廣告人設計的圖案了——形成鮮明反差的柱狀圖將服用者的優勢凸顯出來。其實這只是增大了圖像的對 比,并沒有真正顯著的差異,卻給我們強烈的印象——買一瓶吧!

    凡此種種,不一而足。看來,我們的確有必要學習一點簡單的統計學,這并不能讓你成為精算師,但卻能使你少落入大眾傳媒的陷阱。

    現代社會的問題從信息不足轉變為信息太多,匱乏的危機讓位給了甄別的困難。科學方法可能會成為每個人的必修課。愛因斯坦說:“想象力比知識更重要”,那么面對海量的信息,批判思維也比知識更重要吧。


    TAG: 生活科學家

    Mxie 引用 刪除 michealxie   /   2009-09-21 20:49:40
    5
     

    評分:0

    我來說兩句

    顯示全部

    :loveliness::handshake:victory::funk::time::kiss::call::hug::lol:'(:Q:L;P:$:P:o:@:D:(:)

    Open Toolbar
  • <li id="ccaac"></li>
  • <table id="ccaac"><rt id="ccaac"></rt></table>
  • <td id="ccaac"></td>
  • <td id="ccaac"></td>
  • 床戏视频