辛普森悖論
辛普森悖論 (Simpson’s paradox) 講的是在統計中,有分層和無分層的情況下得到不同的比較結果。假設在台北和高雄做年輕人和老人的台獨意願調查,發現:(以下數據都是範例用,不是真的)
台北 | 支持台獨 | 反對台獨 | 總數 | 支持比例 |
---|---|---|---|---|
年輕人 | 50 | 10 | 60 | 83% |
老人 | 100 | 40 | 140 | 71% |
高雄 | 支持台獨 | 反對台獨 | 總數 | 支持比例 |
---|---|---|---|---|
年輕人 | 50 | 120 | 170 | 29% |
老人 | 20 | 100 | 120 | 17% |
不論台北高雄,年輕人支持台獨的比例都比老人高。
總和 | 支持台獨 | 反對台獨 | 總數 | 支持比例 |
---|---|---|---|---|
年輕人 | 100 | 130 | 230 | 43% |
老人 | 120 | 140 | 260 | 46% |
但是一加總起來發現其實老人支持台獨比率比較高,登愣!個別組內的結果和總體違背,就是這樣啦。
所以你可以看著同樣的數據。如果要反對老人台獨,就把總表蓋掉,說不論台北或高雄年輕人都更支持台獨;如果要反對年輕人台獨,就蓋掉各地調查只看總表,說總共老人支持台獨的比例比年輕人高。要小心對資料的判讀啊!