[新聞] 心理學有一半是錯的?心理實驗的「可複製性危機」已回收
1.媒體來源:
奇摩新聞
2.完整新聞標題:
心理學有一半是錯的?心理實驗的「可複製性危機」
3.完整新聞內文:
https://upload.cc/i1/2018/11/30/69rfDN.jpg
心理學研究的結果不可靠?
根據《自然》期刊的報導,科學家們一場大規模的複製實驗中,
在近乎理想的環境條件下,28項實驗只有一半能得出相同的實驗結果。
面露笑容可以提振實機上的心情?
較常處於高溫氣候的人們對全球暖化有較強的信念?
兄弟姊妹的排行影響人際的利他性格?
這些心理學實驗的「結果」可能因時因地而有誤。
可疑的心理學?
研究結果的可複製性(reproducibility)近年來成科學界
--特別是心理學界--密切審視的話題,
一些研究者在各領域嘗試重複過去發表過的研究結果,得到的結論不一。
這一次由全球科學家共同參與的實驗計畫Many Labs 2,
試圖大規模重新複製過去歷史上名噪一時的心理學實驗。
他們發現,在近乎理想的環境條件下,
28個過去學術界發表過的心理學經典實驗結果,有一半無法成功複製。
這個比例在專家看來可能還算正常。
根據《大西洋期刊》科學作家楊艾德(Ed Yong)的說法:
「每次當心理學家進行類似Many Labs 2的計畫,大規模複製過去的心理實驗,
通常他們成功的比率大約是一半。」
換句話說:「很矛盾的是,在心理學一個最可靠的發現是,
只有一半的心理學研究可以被成功複製。」
在幾年前,Open Science Collaboration進行過為期三年的「可複製性研究計畫」
也曾得到類似的結果。他們重新複製過去100個心理學研究的實驗過程,
大約有40%的研究有相同的結果。
楊艾德說:「就連一些著名的、歷史悠久的案例結論
--心理教科書和TED演講的內容--也可能不是真的。」
實驗結果不可複製,過去心理學家認為和實驗參與者有關:
可能研究人員設計不夠嚴謹、或是刻意操弄數據;
或者是複製實驗時對原初的實驗理解不夠、或使用的數據組太少。
Many Labs 2為了儘可能排除這些質疑,他們這次的研究採取了一些步驟,
包括事先和一些原初實驗的研究者進行討論;
複製實驗的樣本數一定要多於原本的樣本數;
同時,複製實驗重複進行了多次,包括了世界各個不同國家的參與者。
文化差異與不可複製性無關
這次的研究發現,實驗結果能否複製,和文化和地區的差異關係不大。
Many Labs 2的採樣人口包括全球六大洲,報告中認為,
實驗參與者的出身環境與實驗結果能否複製關係不大。
過去心理學的研究多集中在歐美地區,
因此實驗的樣本多半是「西方人、受過教育、工業化、富有、民主」
(Western, educated, industrialized, rich and democratic,字頭縮寫為WEIRD)。
有人因此推論心理實驗的不可複製性和實驗群體的特殊文化特殊有關。
Many Labs 2的研究結果則顯示,將受實驗者的做比較,
「西方人、受過教育、工業化、富有、民主」程度較高(high WEIRDness)的受實驗者
和較低的受實驗者(low WEIRDness)之間,實驗的不可複製性並沒有明顯的差異。
此外,實驗室在實驗室進行,或是透過網路線上進行,
對實驗的可複製性也看不出明顯差別。
實驗複製與科學進步
多倫多史卡波羅大學心理學家因巴爾(Yoel Inbar)在2009年的研究實驗中發現,
較容易體驗噁心厭惡感受的人,有比較高比例的反同志傾向。
他這次也參與了Many Labs 2的研究。他很驚訝自己的研究結果無法複製,
他認為或許他當初的實驗樣本太小,或是人們對同志態度的轉變有關。
他認為實驗結果可複製比例只有一半似乎太低:
「如果我們這麼大的樣本規模,只有丟銅板一樣的比例可以複製,
感覺是哪兒出錯了。」
另一位科學家史卓克(Fritz Strack)則不確定這樣的實驗複製計畫,
對心理學本身能提供多少有用的啟示。不過,他也認為,
每一次的複製都讓我們可以更了解,有那些因素會影響實驗結果:
「與其說是宣告又有某個經典的發現是『假陽性』(false positive)結果,
進行實驗複製的人應該做的是找出有哪些實驗條件影響了結果。」
主持Many Labs 2計畫的心理學家諾塞克(Brian Nosek)則認為,
有兩個重要的理由支持重複實驗的必要。
一方面,複製實驗是為確保實驗本身的結果是可複製的;
同時,也是對過去的研究提出批判。
他說:「證據、批判、和更多的證據來檢驗批判的可行性:這正是科學進展的方式。」
參考資料:Atlantic, Nature
4.完整新聞連結 (或短網址):
https://tinyurl.com/ybze2aco
5.備註:
最著名的「史丹佛監獄實驗」據聞也是假的 「心理學」是否遭遇危機需要變革?
其實 Nassim Nicholas Taleb 早在《黑天鵝效應》就有提到
任何所謂「科學實驗」祇要涉及「人」這巨大變因變素就是「偽科學」
一竿子打翻「社會科學」
就如「經濟學」基本假設「經濟人」會做出理性自利選擇
好比「物理學」基本假設「真空無摩擦力」一樣虛妄不切實際
--
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1543511646.A.D4E.html
→
11/30 01:15,
5年前
, 1F
11/30 01:15, 1F
推
11/30 01:15,
5年前
, 2F
11/30 01:15, 2F
→
11/30 01:15,
5年前
, 3F
11/30 01:15, 3F
推
11/30 01:15,
5年前
, 4F
11/30 01:15, 4F
推
11/30 01:15,
5年前
, 5F
11/30 01:15, 5F
→
11/30 01:15,
5年前
, 6F
11/30 01:15, 6F
→
11/30 01:15,
5年前
, 7F
11/30 01:15, 7F
→
11/30 01:15,
5年前
, 8F
11/30 01:15, 8F
推
11/30 01:15,
5年前
, 9F
11/30 01:15, 9F
推
11/30 01:16,
5年前
, 10F
11/30 01:16, 10F
推
11/30 01:16,
5年前
, 11F
11/30 01:16, 11F
→
11/30 01:16,
5年前
, 12F
11/30 01:16, 12F
推
11/30 01:17,
5年前
, 13F
11/30 01:17, 13F
→
11/30 01:17,
5年前
, 14F
11/30 01:17, 14F
→
11/30 01:17,
5年前
, 15F
11/30 01:17, 15F
推
11/30 01:19,
5年前
, 16F
11/30 01:19, 16F
「社會科學」常希望以「實證主義」驗證其非「偽科學」 但往往適得其反
這下我們研讀「社會科學」是不是祇是在死背 未必符合現實生活實際經驗?
推
11/30 01:23,
5年前
, 17F
11/30 01:23, 17F
→
11/30 01:25,
5年前
, 18F
11/30 01:25, 18F
推
11/30 01:25,
5年前
, 19F
11/30 01:25, 19F
→
11/30 01:26,
5年前
, 20F
11/30 01:26, 20F
推
11/30 01:27,
5年前
, 21F
11/30 01:27, 21F
全部都是「歷史」 甚至「神話」 囧rz
→
11/30 01:27,
5年前
, 22F
11/30 01:27, 22F
推
11/30 01:29,
5年前
, 23F
11/30 01:29, 23F
「占星術」也被認為是「統計學」 這下「心理學」不就矮化到如同算命…
推
11/30 01:31,
5年前
, 24F
11/30 01:31, 24F
→
11/30 01:31,
5年前
, 25F
11/30 01:31, 25F
嗯 我知道的 有交過實驗報告的都知道 XD
推
11/30 01:32,
5年前
, 26F
11/30 01:32, 26F
→
11/30 01:32,
5年前
, 27F
11/30 01:32, 27F
→
11/30 01:32,
5年前
, 28F
11/30 01:32, 28F
→
11/30 01:32,
5年前
, 29F
11/30 01:32, 29F
推
11/30 01:33,
5年前
, 30F
11/30 01:33, 30F
對啊 我備註忘了寫 古人就說過:「人心難測」
推
11/30 01:33,
5年前
, 31F
11/30 01:33, 31F
沒有引入實證主義 基本上都憑直覺 就像蘇格拉底時代
推
11/30 01:33,
5年前
, 32F
11/30 01:33, 32F
我看面對「社會科學」 我祇能靠「死背」 不能「理解」了 歎~
還有 145 則推文
還有 37 段內文
→
11/30 09:54,
5年前
, 178F
11/30 09:54, 178F
→
11/30 09:57,
5年前
, 179F
11/30 09:57, 179F
→
11/30 09:57,
5年前
, 180F
11/30 09:57, 180F
→
11/30 09:57,
5年前
, 181F
11/30 09:57, 181F
【長知識時間】
asd2213857大大所提到的《Social Psychology as History.社會心理學如同歷史》
是出自 Dr. Kenneth J. Gergen 於 1973 年發表之論文
他當時剛取得杜克大學《社會心理學》博士學位不久
這種砸招牌摃扛棒的行為在《行政學》也發生過
因為《行政學》比《心理學》嘴砲太多 在此就不贅述
有興趣看《Social Psychology as History》論文者
在此提供肯尼斯.格根博士執教的賓州斯沃斯莫爾文理學院pdf連結供參
斯沃斯莫爾學院(Swarthmore College)是一所私立的美國文理學院
論文:https://tinyurl.com/ybqlbgw6
推
11/30 10:09,
5年前
, 182F
11/30 10:09, 182F
→
11/30 10:16,
5年前
, 183F
11/30 10:16, 183F
→
11/30 10:16,
5年前
, 184F
11/30 10:16, 184F
是啊 我想任何科學實驗都必須面對「時空問題」 這是再現性癥結之一
推
11/30 10:36,
5年前
, 185F
11/30 10:36, 185F
→
11/30 11:05,
5年前
, 186F
11/30 11:05, 186F
→
11/30 11:05,
5年前
, 187F
11/30 11:05, 187F
→
11/30 11:06,
5年前
, 188F
11/30 11:06, 188F
《 nature.自然 》期刊原文
https://www.nature.com/articles/d41586-018-07474-y
其中提到實驗項目部分是這段:
They include classic studies such as psychologist Daniel Kahneman's
1981 work on framing effects, a form of cognitive bias
in which people react differently to a particular choice
depending on how it is presented (the study was successfully replicated),
and modern research, including work by Yoel Inbar in 2009
showing that people who were more likely to experience feelings of disgust
tended to be more homophobic.
我再找找看有沒有究竟哪28個心理學實驗詳盡細目
其實原文標題是:
「 Replication failures in psychology
not due to differences in study populations 」
直接否定掉再次實驗所研究之「人群差異」造成之影響 這就有趣了 ww
那我可不可以說《 nature.自然 》也太武斷呢? XD
維吉尼亞州大學心理學教授 Brian Nosek (耶魯大學心理學博士)是有提到:
「 We wanted to address the common reaction that,
of course the replication failed because the conditions changed,
and people are different, 」 says Nosek.
「 It's a possible explanation, but not a satisfying one,
because we don't know why that difference is important. 」
表示他不排除「人群差異」是造成實驗有半數無法再現的可能解釋
噓
11/30 11:12,
5年前
, 189F
11/30 11:12, 189F
推
11/30 11:28,
5年前
, 190F
11/30 11:28, 190F
「成大電機」、「政大資管」算文組?
推
11/30 11:38,
5年前
, 191F
11/30 11:38, 191F
推
11/30 11:40,
5年前
, 192F
11/30 11:40, 192F
推
11/30 11:42,
5年前
, 193F
11/30 11:42, 193F
找到28個《心理學實驗》項目了 有興趣的可以看看這篇列表一
https://psyarxiv.com/9654g/ 以下僅列出實驗名稱及最初實驗者
1. Direction & SES (Huang et al., 2014)
2. Structure and goal-pursuit (Kay et al., 2014)
3. Incidental disfluency (Alter et al., 2007)
4. Moral Foundations (Graham et al., 2009)
5. Affect and Risk (Rottenstreich & Hsee, 2001)
6. Priming consumerism (Bauer et al., 2012)
7. Correspondence Bias (Miyamoto & Kitayama, 2002)
8. Disgust & Homophobia (Inbar et al., 2009)
9. Incidental Anchors (Critcher & Gilovich, 2008)
10. Social Value Orientation (Van Lange et al., 1997)
11. Trolley Dilemma 1 (Hauser et al., 2007)
12. SMS & Well-Being (Anderson et al., 2012)
13. False Consensus 1 (Ross et al., 1977)
14. False Consensus 2 (Ross et al., 1977)
15. Position & Power (Giessner & Schubert, 2007)
16. Framing (Tversky & Kahneman, 1981)
17. Trolley Dilemma 2 (Hauser et al., 2007)
18. Tempting Fate (Risen & Gilovich, 2008)
19. Actions are Choices (Savani et al. 2010)
20. Intuitive Reasoning (Norenzayan et al. 2002)
21. Less is Better (Hsee, 1998)
22. Moral Typecasting (Gray & Wegner, 2009)
23. Moral Cleansing (Zhong & Liljenquist, 2006)
24. Assimilation and Contrast (Schwarz et al., 1991)
25. Choosing or Rejecting (Shafir, 1993)
26. Priming warmth (Zaval et al., 2014)
27. Intentional Side Effects (Knobe, 2003)
28. Direction and Similarity (Tversky & Gati, 1978)
推
11/30 12:11,
5年前
, 194F
11/30 12:11, 194F
→
11/30 12:11,
5年前
, 195F
11/30 12:11, 195F
→
11/30 12:12,
5年前
, 196F
11/30 12:12, 196F
→
11/30 12:12,
5年前
, 197F
11/30 12:12, 197F
→
11/30 12:12,
5年前
, 198F
11/30 12:12, 198F
→
11/30 12:13,
5年前
, 199F
11/30 12:13, 199F
→
11/30 12:13,
5年前
, 200F
11/30 12:13, 200F
→
11/30 12:14,
5年前
, 201F
11/30 12:14, 201F
→
11/30 12:14,
5年前
, 202F
11/30 12:14, 202F
→
11/30 12:14,
5年前
, 203F
11/30 12:14, 203F
→
11/30 12:18,
5年前
, 204F
11/30 12:18, 204F
→
11/30 12:18,
5年前
, 205F
11/30 12:18, 205F
→
11/30 12:19,
5年前
, 206F
11/30 12:19, 206F
→
11/30 12:20,
5年前
, 207F
11/30 12:20, 207F
→
11/30 12:21,
5年前
, 208F
11/30 12:21, 208F
非常感謝您的寶貴意見 m(_._)m
「社會科學」就是這樣 變項太多 難以控制掌握 因此再次見證奇蹟時刻有困難
這就是「社會科學」與「自然科學」一個很大的歧異點
實驗條件難以完美複製 人太容易心隨境轉
同一個體進行相同實驗可能每次隨時空遞嬗造成行為大不同
我在想 如果今天運氣好 他們28項實驗都僥倖完美重現了
不知道他們又會下什麼結論呢? 而且這次重現能擔保下次重現嗎?
我相信這28個實驗再換實驗者&實驗對象再做一次肯定再現成敗比例又不同
推
11/30 16:30,
5年前
, 209F
11/30 16:30, 209F
我有看過 John Nash 的傳記電影《美麗境界》 很感人
【賽局理論】或稱【博奕論】主要是應用在【經濟學】領域
在兩種甚至多種選擇之間可以找出雙贏甚至多贏的最佳解 稱之為【納許均衡】
John Nash 也因此和另兩位同為賽局理論專家 John Harsanyi、Reinhard Selten
共同獲得1994年諾貝爾經濟學獎
這三位數學家在非合作博弈的均衡分析理論方面做出了開創性的貢獻
對博弈論和經濟學產生了重大影響
不可否認【賽局理論】涉及了【心理】層面 例如著名的【囚徒困境】就需要交相賊
必須要兩位理性且頭腦清楚的人 才能在無法聯繫對方的情況下做出雙贏的最佳選擇
我想如果是【海綿寶寶】&【派大星】這兩位活寶應該永遠無法達到【納許均衡】XD
【補充】 其實搞不好這兩位才是最能求得比【博拉圖最適】更優的【納許均衡】
最佳解的不二人選 因為他們對彼此絕對信任對方不會背叛自己
※ 編輯: PReDeSTiNeD (36.238.114.99), 11/30/2018 19:05:06
推
11/30 19:43,
5年前
, 210F
11/30 19:43, 210F