Re: [討論] 有關名次問題(有點一言難盡 )

看板Statistics作者 (統計 非 人生)時間12年前 (2012/11/09 10:23), 編輯推噓0(0027)
留言27則, 2人參與, 最新討論串2/2 (看更多)
這是個有趣的現象, 我從沒想過這個問題. 先假設一個簡單的分數計算方式 A 科的成績 Z_a ~ N(0,1) 分配 B 科的成績 Z_b ~ N(0,1) 分配 兩科皆是數值愈高代表成績愈好 名次的比較是由兩科加總來排名 假定兩科的相關係數為 rho=0 則 Z_a + Z_b ~ N( 0 , 2+2rho ) = N(0,2) 甲生 A 科的分數為 1, 光看 A 科的排名大約是 15.67% ( note: P( Z_a>1 )*100% ~= 15.67% ) 甲生 B 科的分數為 1, 光看 B 科的排名也大約是 15.67% 但兩科加起來的排名是 P(Z_a + Z_b > 2)*100% 大約是 7.86% 以這個例子看單科都是在 15.67% 的名次, 但兩科一起看是 7.86% 的名次 當然這和相關係數有關 例如相關係數 rho=1 時, 每人在兩科的分數皆相同, 加總分數後的排名還是 15.67% 但也可能存在個別排名是高, 總排名是低的情況. 就如 ching0629 在推文所說: 21 個國家看十個指標, 若有一個國家在每個指標排第 3 名, 也有可能在總排名是第 21 名. 說明: 例如 A 國家在每個指標上拿 1 分, 而其餘的國家分別在任兩個指標分別拿100與99分, 且在其它指標上是 0 分. 而且每個指標只有一個100分,一個99分與一個1分, 其它是0分. 則 A 國家是每個指標上的第 3 名, 但總分或平均分數來比較, 排名上是最後一名. 這個例子可以做為我一開始看法情況的反例. ※ 引述《Bartholemew (蘋果樹 )》之銘言: : 比方說,如果把指考六科分別的頂標加在一起,可能是450 : 可是以總分來看,你只要430可能就是總分的頂標了 : 要怎麼解釋這樣的現象呢? : 這個現象在日常生活很常出現 : 比如說,最近評比世界的投資環境 : 台灣只有兩項是在前十名(不到前五名),剩下的有不少都在五十名之後 : 結果綜合平均,台灣有到16名,讓我頗為納悶 : 總之,敢問板上高手,要怎麼解釋這類現象呢?(抱歉我對統計的知識不是很夠,請用淺白 : 一點措詞解釋,感謝) -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 180.176.160.149

11/09 10:27, , 1F
這個解法是不錯,不過這不是很基本的原理嗎? 尤其是原po
11/09 10:27, 1F

11/09 10:29, , 2F
問的
11/09 10:29, 2F

11/09 10:30, , 3F
我想原PO還有個事情沒有弄懂,那就是名次是序位尺度,而
11/09 10:30, 3F

11/09 10:31, , 4F
平均數是不可能用序位尺度算的,而是用分數(等距尺度)
11/09 10:31, 4F

11/09 10:31, , 5F
序位尺度只保證 1的分數>2的分數, 2的分數>3的分數
11/09 10:31, 5F

11/09 10:32, , 6F
但不保證 1的分數-2的分數 = 2的分數-3的分數
11/09 10:32, 6F

11/09 10:32, , 7F
就世界排名這個部份來說,似乎是重點是序為尺度的問題
11/09 10:32, 7F

11/09 10:34, , 8F
假設有10個指標,某國每項都第3名,若它總和排第21名也是
11/09 10:34, 8F

11/09 10:34, , 9F
有可能的
11/09 10:34, 9F

11/09 11:08, , 10F
這不是 "解法", 是 "看法". 我也不曉得 "基本原理" 是什麼
11/09 11:08, 10F

11/09 11:08, , 11F
但你的看法很有趣, 尤其是在 10:34 那兩行, 或者你有個清
11/09 11:08, 11F

11/09 11:09, , 12F
楚的例子支持你的看法
11/09 11:09, 12F

11/09 11:09, , 13F
?
11/09 11:09, 13F

11/09 11:16, , 14F
我想到了, 的確要找個極端的例子支持 10:34 是可能的
11/09 11:16, 14F

11/09 11:18, , 15F
我的看法也只是對普遍現象找個比較合理的解釋, 並不是一定
11/09 11:18, 15F

11/09 11:19, , 16F
要套用這個規則
11/09 11:19, 16F

11/09 11:29, , 17F
我知道你的想法很棒,這是一個很不錯的證明
11/09 11:29, 17F

11/09 11:29, , 18F
但這樣容易造成一個誤導,那就是個別名次較低,總和名次較
11/09 11:29, 18F

11/09 11:30, , 19F
高(若以原PO想問的問題而言),事實上你的意思是,個別分數
11/09 11:30, 19F

11/09 11:30, , 20F
排序較低,總和分數的排序會較高
11/09 11:30, 20F

11/09 11:31, , 21F
事實上以序位尺度代替實際分數呈獻的資料,很有可能發生
11/09 11:31, 21F

11/09 11:31, , 22F
個別名次的總平均高(把序位尺度平均),而總名次卻低
11/09 11:31, 22F

11/09 11:37, , 23F
你說的是對的. 但這不是證明, 我來修個文補充你的意思
11/09 11:37, 23F
※ 編輯: ADORIAN 來自: 180.176.160.149 (11/09 11:50)

11/09 11:46, , 24F
那就拜託你了,我的意思不是證明,是我覺得原PO的問題是出
11/09 11:46, 24F

11/09 11:46, , 25F
在不夠了解序位尺度的特性
11/09 11:46, 25F

11/09 11:49, , 26F
如果可以的話把我的推文修掉好了,我覺得表達不太好
11/09 11:49, 26F

11/09 11:52, , 27F
不, 你的說明也是個想法, 補全我想的不周. 多謝.
11/09 11:52, 27F
※ 編輯: ADORIAN 來自: 180.176.160.149 (11/09 11:53)
文章代碼(AID): #1Gd6aNty (Statistics)
文章代碼(AID): #1Gd6aNty (Statistics)