[ Daniel Kahneman, Paul Slovic and Amos Tversky (eds.)(1982), Judgment under Uncertainty: Heuristics and Biases (Cambridge University Press)
다니엘 카네만, 『불확실한 상황에서의 판단』, 이영애 옮김 (아카넷, 2010)
이 장은 Cognitive Psychology, 1972, 3, 430-454에 게재된 것을 줄여 쓴 것임. ]
1. 대표성 결정인자 (Determinants of representativeness)
1.1. 표본과 전집의 유사성 (Similarity of sample to population)
1.2. 무선성 반영 (Reflection of randomness)
2. 표집 분포 (Sampling distributions)
3. 규범 모형과 기술 추단 (Normative models and descriptive heuristics)
[p. 32, 43-44]
- 우리가 내리는 결정, 결론, 설명은 불확실한 사건들의 우도(likelihood)에 관한 판단에 의존함.
- 여러 연구들의 일반적인 결론은, 사람들이 불확실한 사건의 우도를 판단할 때 확률이론을 따르지 않는다는 것.
• 여러 확률 법칙이 직관적으로 명백하지 않을 뿐만 아니라 쉽게 적용할 수도 없음.
• 그러나 객관적 확률로부터 주관적 확률의 이탈이 신뢰할 수 있고 체계적이고 제거하기 어려운 것처럼 보인다는 사실은 명확하지 않음.
• 사람들은 확률 법칙을 추단으로 대치하는 듯한데, 추단은 합리적 추정치를 산출하기도 하지만 그렇지 못한 경우가 많음.
[p. 33, 44]
- 대표성 추단(representativeness heuristics)을 따르는 사람이 불확실한 사건이나 표본의 확률을 평가할 때 의존하는 것
• (i) 그 기본 특성이 모집단과 비슷한 정도
• (ii) 사건이나 표본이 생성되는 과정의 두드러진 특징을 반영하는 정도
- 이 논문의 기본 입장
• 여러 상황에서, 사건 A가 사건 B보다 더 대표적으로 보일 때마다 사건 A가 사건 B보다 더 있음직하게 판단된다는 것.
• 주관적 확률에 의한 사건들의 서열화(ordering)는 대표성에 의한 서열화와 같다.
1. 대표성 결정인자 (Determinants of representativeness)
[p. 33, 45]
- 이 절에서 다루는 것
• 표본이나 사건들의 어떤 특징들이 그것들을 대표적으로 만드는지 논의
• 그러한 특징들이 주관적 확률에 주는 효과를 설명.
1.1. 표본과 전집의 유사성 (Similarity of sample to population)
[p. 34, 45-47]
- 문제: “자녀가 여섯 명인 가족을 모두 조사하였다. 그 중 아들과 딸의 출생 순서가 정확하게 〈딸・아들・딸・아들・아들・딸〉인 가족은 72가족이었다. 당신은 조사된 가족 중 출생 순서가 〈아들・딸・아들・아들・아들・아들〉인 가족이 몇 가족이라고 추정하겠는가?”
• 두 경우의 출생 순서가 거의 같은 우도를 가질 것이지만, 사람들은 이 둘의 대표성이 같지 않다는 주장에 동의함.
• 피험자 92명 중 75명은 아들 다섯과 딸 하나의 순서는 표준 순서에 비해 별로 있을 듯하지 않다고 판단함(P<.0l, sign 검증에 의함)
- 아들 셋과 딸 셋이 있는 가족의 빈도와 비교해서 아들 다섯과 딸 하나가 있는 가족의 빈도를 평가할 때 피험자들은 서열 정보를 무시하는 것은 아닌가?
• 같은 피험자들이 추정한 <아들・아들・아들・딸・딸・딸>의 순서의 가족 빈도는 <딸・아들・아들・딸・아들・딸>의 가족 빈도보다 훨씬 더 유의미하게 적음(P<.01),
• 이는 아마도 전자가 덜 무선적으로 보이기 때문인 듯함.
• 따라서 서열 정보가 무시된 것은 아님.
- 대표성을 결정하는 요인은 표본이 전집에 있는 다수-소수 관계를 유지하는지와 관련됨.
• 다수-소수 관계를 유지하는 표본은, 이 관계를 위반하지만 (객관적으로) 똑같은 우도의 표본보다 더 있음직하다고 판단함.
- 여러 가능한 결과들이 포함된 표본이 결과의 일부가 포함되지 않은 표본보다 더 대표적.
• 예) p=4/5인 이항분포에서, 유의미하게 많은 수의 피험자들은 어떤 표본에서 10번의 성공과 실패가 전혀 없을 우도가, 또 다른 표본에서 6번의 성공과 4번의 실패가 있을 우도보다 적다고 판단함.(실제로는 앞 표본의 우도가 더 큼)
[pp. 34-35, 47]
- 대표성의 편향 효과는 전문적인 심리학자들의 직관적 판단에서도 발견됨.
• 표본의 크기를 충분히 고려하지 않고도 (전집에서의) 실제 결과는 (표본에서의) 유의미한 결과로 나타날 것을 기대함.
• 그 결과, 연구자들은 영가설(null hypothesis)이 틀리다고 생각할 때마다 유의미한 결과의 우도를 과대추정 하는 경향이 있음.
- 수리심리학회와 미국심리학회 참석자들에게 준 문제
• 현실적으로 바람직한 확률 추정치는 .50보다 다소 낮음.
• 응답자들의 중앙 추정치는 .85
• 유의도의 반복 검증에 부여하는 이와 같은 정당화되지 못한 확신은, 유의도를 비현실적으로 기대하게 하고 통계적 검증력이 결여된 연구를 계획하게 만듦(J. Cohen, 1962).
1.2. 무선성 반영 (Reflection of randomness)
[p. 35, 48]
- 어떤 불확실한 사건이 대표성을 가지려면 모집단과 비슷할 뿐 아니라, 그 사건이 생성된 불확실한 과정의 특성인 무선성을 반드시 보여야 함.
• 외견상의 무선성(apparent randomness)을 결정하는 구체적 특징도 맥락에 따라 달라지는데도 불규칙성(irregularity)과 국소적 대표성(local representativeness)은 무선성에 관한 직관적 개념을 잘 나타냄.
[pp. 35-36, 48-49]
- 외견상 무선성의 주된 특성은 어떤 체계적 패턴이 없다는 점.
• 예) 연속적 동전던지기에서 어떤 뚜렷한 규칙성은 대표성을 나타내지 않음.
• 예) 아동 다섯 명에게 돌 스무 개를 무작위로 나누어줄 때의 분포. 게임이 여러 번 계속되면 I 또는 II 중 어느 유형이 더 많아질 것인가?
• II와 같은 획일적 분포는 그 객관적 우도가 비-획일적인 I과 같은 분포의 우도보다 더 크지만 무선 과정의 결과로 보기에는 너무 규칙적임.
• 피험자 중 유의미한 다수(52명 중 36명, p<.01, 사인 검증에 의함)가 분포 I이 분포 II보다 더 가능성이 있다고 봄.
• 약간의 변동은 대표성에 기여하고, 따라서 불확실한 사건의 외견상의 우도에 기여함.
- 피험자들은 두 분포의 개별 특성은 무시한 대신, 두 분포의 유목(class)을 비교함.
• 이 과정에서 아동들에게 주어진 돌들의 특유한 분배는 문제 삼지 않음.
• 이것은 피험자들이 유목과 그 범례들의 구분을 인식하지 않았음을 의미하는 것이 아니라 이러한 구분이 상대적 빈도 판단에 주는 영향을 인식하지 못하였음을 의미함.
- 사람들은 우연을 예측할 수 없지만 본질적으로 공평하다고 봄.
• 돌을 순수하게 무선 할당하면 각 아동이 대략 같은 수의 돌을 가지게 될 것으로 기대함.
• 대표적 표본은 모집단의 기본 특징이 표본 전체에서 총체적으로 나타나고, 각 부분에서도 국소적으로 나타나는 집단.
• 그러나 국소적 대표성이 있는 표본은 우연적 기대에서 체계적으로 이탈하기 쉬운데, 이는 부분적 교체가 심하고 군집이 적기 때문.
[p. 36, 49-50]
- 큰 수 법칙은 매우 큰 표본들이 그들이 나온 전집을 잘 대표함을 보장함.
• “큰 수 법칙은 작은 수에도 마찬가지로 적용된다.”(Tversky & Kahneman, 1971, 2)
• 이 믿음은 다양한 맥락에서 관찰되는 무선성에 관한 잘못된 직관에 기반함.
• 무선성 지각에 관한 연구: 사람들이 연속적 동전던지기와 같은 무선 과정을 생성하라는 말을 들었을 때, 그들은 국소적으로 대표적인 연쇄를 지나치게 짧은 구획으로 산출함.(Tune 1964; Wagenaar, 1970)
• 사람들은 정확한 분포를 가진 연쇄에 대하여, 긴 구획은 국소적으로 대표가 되지 못한다고 생각하기 때문에, 이를 그럴듯하지 않다고 간주하거나 비-무선적이라고 거부함.
확률학습과 이항 예측을 다룬 여러 연구 [50-51]
- 도박꾼의 오류나 부적 최신 효과(negative-recency effect)는 국소적 대표성에 대한 믿음의 표현.(Estes, 1964; M. R. Jones, 1971)
• 짧은 구획에서 두 결과의 비율을 보존하려면, 긴 구획의 결과는 다른 결과가 뒤따라야 균형을 되찾게 됨.
- 펠러는 『확률이론 개론 Introduction to Probability Theory』에서 국소적 대표성에 두는 믿음이 잘못되었음을 예시.(Feller, 1968, 160쪽)
• 2차 대전 중 런던이 집중 폭격을 당할 때 그 폭격 패턴이 무선적이지 않다고 생각함.
• 도시의 어떤 지역은 여러 번 폭격을 받았지만 다른 지역들은 그렇지 않았기 때문.
• 이 가설을 검증하기 위하여, 런던 남부 전 지역을 똑같은 면적으로 분할한 다음, 각 면적이 받은 폭격의 실제 분포를 무선적 폭격이 가정하는 예상(푸아송 분포)과 비교.
• 분포들은 서로 잘 일치함.
• 펠러: “훈련받지 않은 사람들의 눈에 무선성은 규칙성이나 군집 경향으로 보인다.”
- 23명인 집단에서 적어도 두 사람이 생일이 같을 확률이 .5임.(Feller, 1968, 84-88)
• 이 사실을 알면 많은 학생들은 놀람.
• 23명이 있으면 예상되는 생일 수는 매일 기준으로 1/15 미만.
• 따라서 두 명의 생일이 중복되는 날은 343일의 빈 날이 있는 맥락에서는 대표적이 아니므로 그 우도는 매우 낮아 보임.
• 일반적으로 확률 이론에서 여러 결과들의 반-직관적 성질은 대표성의 위반 때문이라고 추측할 수 있음.
2. 표집 분포 (Sampling distributions)
[52]
- 표본을 비율이나 평균과 같은 통계치로 기술할 때, 표본이 전집을 대표하는 정도는 그 통계치가 전집의 모수치와 얼마나 비슷한지로 정해짐.
• 표본의 크기가 모집단의 그 어떤 특성도 반영하지 않으므로, 표본의 크기는 대표성에 영향을 주지 않음.
• 예) 1천 명의 유아 표본에서 600명 이상의 남아를 찾는 사건은 100명의 유아 표본에서 60명 이상의 남아를 찾는 사건만큼 대표적.
• 두 사건들은 확률이 같다고 판단되지만, 사실 후자의 우도가 더 크다.
- 이 예측을 검증하기 위하여 피험자 집단 아홉 개에서 다음 세 전집 각각에 대하여 세 표본 크기(N= 10, 100, 1000)에서 주관적 표집 분포를 산출함.
(1) 성(sex)분포. (이항분포 .50)
(2) 심장 박동 유형의 분포. (이항분포, p=.80)
(3) 키 분포
[55]
- 세 전집의 각 중앙 추정치는 그림 1, 2, 3에 세 개의 값에 나옴.
- 표본 크기가 주관적 표집 분포에 어떤 형태로든 아무 영향도 주지 못함이 분명함.
• 피험자 집단별로 표본 크기만 바꾼 문제들을 받았으나, 산출된 분포는 표본 크기에 따라 서로 구분되지 않음.
• 이 결과는 이항분포처럼 추상적으로 정의된 전집뿐만 아니라 남자들의 키처럼 일상생활에서 잘 알려진 전집에도 해당됨.
[55-57]
- 주관적 표집 분포가 N과는 독립적이므로, 각 그림에서 중앙 추정치의 평균을 연결한 실선이 각 전집에 관한 “보편적”(universal) 표집 분포로 간주함.
- 그림 4는 p=.50에 대한 표집 분포를 나타내며, 그림 5는 p=.80에 대한 표집 분포를 나타냄. 이 둘은 그와 일치하는 “보편적” 표집 분포를 함께 제시함.
(피험자들이 완전히 무시하는 표본 크기의 실제 효과의 양을 나타내기 위한 것.)
- 이항분포에서, 평균은 일반적으로 최빈치(mode)와 일치한다.
• 결과적으로 p≠.50일 때, 그림 4에서 N=10일 때의 정확한 분포에서처럼, 짧은 꼬리가 긴 꼬리보다 분명히 더 높다.
• 그림 5는 이 특성이 p=.80 일 때 그 평균이 .63에 불과한 “보편적” 곡선과는 다름을 보여줌.
- 주관적 표집 분포의 최빈치가 가장 대표적인 값으로 적절히 위치하지만, 평균은 긴 꼬리 쪽으로 치우침.
• p=.80일 때 비율의 “보편적” 표집 분포는 이항분포와 전혀 다르다!
[pp. 41-42, 57-58]
- 주관적 이항분포에 관한 이전 연구들
• (1) 이전의 연구들은 현재의 연구보다 훨씬 작은 크기의 표본에 관심을 가졌다.
• (2) 확률 분포상의 사건이 표본 크기에 따라 다르다는 것. 즉 크기 N의 표본에서 피험자들은 N+1개의 결과를 평가함.
- 이 연구에서는 피험자들이 모든 표본 크기에 대하여 같은 수의 범주를 평가함
• 그림 1, 2, 3에 나오는 N에 관한 주관적 표집 분포의 불변성은 범주의 수가 언제 변하는지 또는 목록들을 열거할 수 있을 정도로 표본이 작을 때가 언제인지에 대한 정보를 가지고 있지 않다.
• 표본이 크면 열거하기 불가능하므로, 이때는 표본 평균이나 표본 비율에 의해 지배되는 대표성을 직접 평가하는 것이 자연스럽다.
■ 표본 크기에 관한 대표성 예측을 더 알아보기 위한 추가 실험 [58-59]
- 피험자는 확률이나 통계 지식이 전혀 없는 스탠퍼드 대학생 5-12명을 소집단으로 참여
• 피험자들에게는 특정 평균과 그 평균에 대한 임계값(critical value)으로 표집 과정을 상술하는 세 문제를 정해진 순서로 제시하고, 특정 표집 결과가 소표본과 대표본 중 어디에서 발생할 가능성이 더 클지를 판단하게 함.
• 각 피험자는 실험에 참여하고 달러를 받았으며, 과제를 끝낸 후 무선으로 선택한 과제를 맞히면 추가로 달러를 더 받았다.
• 반응 편향을 통제하려고 각 문제를 두 가지 형태로 제시함.
- 문제(1): 어떤 도시에 병원이 두 개 있다. 큰 병원에서는 매일 신생아 45명이 태어나고, 작은 병원에서는 매일 신생아 15명이 태어난다. [...]
- 문제(2): 언어의 어떤 특성을 연구하는 한 연구자가 소책자를 선택해서 그 책의 각 쪽에 있는 평균 단어의 길이를 계산하였다. [...]
- 문제(3): 관상질환(coronary disease)의 요인들을 연구하기 위한 의학 조사를 실시한다.
[60]
- 피험자들에게 표본 크기의 역할에 대한 통찰이 있다면, 간단한 서열 질문에 대한 정답을 쉽게 택할 수 있을 것.
- 대표적인 결과가 발생할 우도가 동등하다고 판단하면, 정답에 대하여 어떤 체계적 선호도 보이지 않을 것.
- 결과: 거의 모든 비교에서 〈같다〉라는 답변 형태가 가장 빈번했으며, 어떤 문제에서든 정답에 대한 유의미한 선호가 없었음.
[61]
- 표집 변량이 표본 크기에 비례해서 감소한다는 생각은 사람들의 직관의 일부가 아니라는 것.
• 표본 크기의 역할을 인식하지 못하는 경향이 일상적으로 자주 일어남.
• 사람들은 관찰의 수가 터무니없이 적다는 것은 상관하지 않고 백분율로 진술된 결과만을 진지하게 받아들임.
• 사람들은 큰 표본에서 얻은 확실한 증거에 회의적.
예) 생활 지표가 전집이 아닌 큰 표본을 근거로 하고 그것도 〈무선 표본〉을 근거로 한다고 격하게 불평하는 유명한 정치가
- 사람들이 표본 크기가 표집 변량에 주는 영향을 평가할 수 없다는 뜻이 아님.
• 사람들은 별 어려움 없이 정확한 규칙을 배운다.
• 문제는 사람들을 스스로 생각하도록 내버려두면 그들은 정확한 규칙을 따르지 않는다는 것
• 정확한 규칙을 알고 통계 훈련을 심도 있게 받은 심리학자들도 표집 크기의 영향을 과소추정하려는 경향을 보임.(J. Cohen, 1962; Tversky & Kahneman, 1971, 2)
3. 규범 모형과 기술 추단 (Normative models and descriptive heuristics)
[p. 46, 61-62]
- 사람들은 대체로 정확한 베이지안 규칙을 따르지만 증거의 영향을 충분히 평가할 수 없으므로 보수적이라는 주장(W. Edwards, 1968, 25).
• 피터슨과 비치는 규범 모형(normative model)이 “적합한 변수에 의해 적합한 방향으로 영향을 받는“ 사람들의 행동을 잘 기술한다는 결론을 내림.(Peterson & Beach, 1967, p. 43)
- 반대 입장
• 슬로빅과 리헨슈타인은 직관적 통계학자로서 인간의 수행에 관한 위와 같은 평가가 “너무 관대하다”고 주장.(Slovic & Lichrensrein, 1971)
• 피츠, 다우닝, 라인홀드는 베이지안 과제에서 인간의 수행은 “보수주의 논지가 함축하는 것보다 더 근본적 면에서 최적이 아니다”라고 결론을 내림.(Pits, Downing, & Reinhold, 1967, p. 392)
[62]
- 주관적 확률의 분석과 모형화에 대한 베이지안의 규범적 접근의 유용성은 주관적 추정치의 정확성에 의존하지 않고, 오히려 그 모형이 판단 과정에서 기본 결정인자들을 포착하는가에 있음.
- 이 논문에서 소개된 연구는 그렇지 못함을 시사함.
• 표본 크기가 주관적 표집 분포에 영향을 주지 못하고, 사후 이항 추정치들이 표본의 차이보다는 표본의 비율로 결정되고, 이 추정치들이 전집 비율에 의존하지 않음.
• 이러한 증거를 평가해 보면, 사람은 베이즈주의자가 전혀 아니다.
[62]
- 규범 모형이 인간의 행동을 기술하지 못하는 것은 일반 사람들이 친숙하지 않은 무선 과정에 접할 때로 한정되며, 일상적으로 경험하는 친숙한 무선 과정들의 평가는 잘 해낸다고 볼 수 있음.
- 그러나 이를 지지하는 증거는 거의 없다.
• (1) 대표성을 고려한다 해도 같은 유형의 체계적 오류가 경험 많은 과학자들의 직관적 판단에서도 발견됨(Tversky & Kahneman, 1971, 2).
• 확률 이론을 안다는 것이 우연의 법칙에 관한 모든 잘못된 직관을 제거해 주지 못함이 분명함.
• (2) 일상생활에서 이항 법칙을 따르는 수많은 무선 과정을 접하지만 사람들은 이러한 경험들에서 이항 분포의 적합한 개념을 끌어내지 못함.
• 수많은 예를 경험하는 것만이 최적 행동을 산출한다는 말은 아니라는 것.
[63]
- 사람들은 독특한 상황을 판단할 때도 같은 추단을 사용함.
• 예) 어떤 12세 소년이 커서 과학자가 될 가능성이 얼마인가? -> 그 소년의 인상이 과학자의 역할을 얼마나 잘 대표하는지의 정도로 평가
• 예) 이 후보가 공직자로 당선될 확률이 얼마인가? 회사가 파산할 확률은? -> 사람들은 회사나 정치적 상황의 모형을 마음에 두고 그 모형의 기본 특징들을 가장 잘 대표하는 결과를 가장 있을 법한 것으로 평가함.
(2019.07.16.)