.: [과학철학] 기어리 외, 8장. “인과적 가설의 평가” 요약 정리 (미완성)

2020/07/12

[과학철학] 기어리 외, 8장. “인과적 가설의 평가” 요약 정리 (미완성)

[ Ronald N. Giere, John Bickle, and Robert Mauldin (2005), Understanding Scientific Reasoning, 5th Edition (Cengage Learning)

Ronald N. Giere 외, 『과학적 추론의 이해』 [제5판], 조인래・이영의・남현 옮김 (소화, 2008), 353-438쪽. ]

8.1. 사카린과 암

8.2. 임의화 실험 설계

8.3. 이중맹검 연구

8.4. 정신분열증과 유전

8.5. 전향적 설계

8.6. 정신분열증의 병인과 유전자

8.7. 후향적 설계

8.8. 인과적 가설을 위한 통계적 증거

8.9. 요약

8.1. 사카린과 암

- 1977년 3월, 미국 식품의약국은 캐나다의 연구를 근거로 하여, 사카린을 함유한 물질의 판매를 금지함.

■ 사카린의 위험

- 결론: 사카린이 인간에게 잠재적인 발암 물질이다.

- 결론의 증거: 2세대에 걸친 쥐 실험

■ 동물 연구

- 투여 경로: 인간이 음식물 섭취로 인해 병에 노출된 경우, 검사되는 물질을 실험동물에게 공급하는 것도 먹이를 통한 방식으로 이루어져야 함.

• 강제로 먹이는 것은 허용되지 않음.

- 작은 동물 이용

- 긍정적인 사양실험(feeding trial)

• 2세대 쥐들은 수태되는 순간부터 실험이 종료될 때까지 사카린에 노출되어 있었음.

• 2세대의 모든 쥐가 죽었을 때, 또는 실험 2년 후에 죽여서 암 검사를 실시함.

- 사카린을 섭취하지 않은 적절한 대조군(control group)의 존재

8.2. 임의화 실험 설계

- 임의화 실험 설계(randomized experimental design, RED)

■ 실세계 모집단과 인과적 가설

- 관심의 대상이 된 모집단: 인간

- 실제로 표집된 모집단: 실험용 쥐

• 이 통계적 방법은 쥐에 관한 결론만 허용함.

• 쥐에게 일어나는 일과 인간에게 일어날 수 있는 일 사이에 성립하는 가능한 관계는 다른 종류의 증거를 이용하여 평가해야 함.

- 원인 변수(cause variable): 사카린 섭취

- 결과 변수(effect variable): 방광암 발생

- 인과적 가설: 사카린 섭취가 실험용 쥐에게 방광암의 발생을 야기하는 긍정적 원인이다.

■ 표본 자료

- <표 8.1>

• 사카린을 전혀 섭취하지 않은 쥐 74마리 중 1마리만 방광암에 걸림

• 사카린이 5% 함유됨 음식을 섭취한 쥐 78마리 중 7마리가 방광암에 걸림

■ 실험 설계

- 인과적 가설을 시험하기 위해 과학자들은 두 가정적 모집단에서 표본의 역할을 할 현실적 표본을 만들어냄.

• 실제 모집단에서 표본 하나를 임의로 선택한 다음, 그 표본을 임의의 두 집단으로 나누는 방식

- (i) 실험군과 대조군

• 실험군(experimental group, x군): 한쪽 집단의 모든 개체들은 X라고 불렀던 가정적 모집단을 정의하는 조건을 갖추도록 실험적으로 조작됨.

• 대조군(control group, k군): 다른 집단의 모든 개체들은 우리가 K라고 불렀던 가정적 모집단을 정의하는 조건을 갖추도록 조작됨.

- (ii) 실험군과 대조군을 나누는 절차

• 절차(1): 동전을 던져 나오는 결과에 따라 실제 모집단에 있는 각 쥐에게 사카린을 든 음식을 먹일지 여부를 결정한 뒤, 쥐 한 마리를 임의로 선택함.

• 절차(2): 실제 모집단에서 쥐 한 마리를 임의로 선택한 다음, 동전을 던져 나오는 결과에 따라 그 쥐에게 사카린이 든 음식을 먹일지 여부를 결정한다.

• 선택한 쥐가 실험군에 속한 확률은 어떤 방식으로 결정하든 동일함.(1/2)

• 절차(2)는 실제로 정상적인 상황에서 시행될 수 있다는 장점이 있음.

- (iii) 임의 표본

• 실험용 쥐들은 주의 깊게 관리된 조건에서 사육되었으므로 임의 표본으로 간주될 수 있음.

• 개개의 쥐를 실험용이나 대조용으로 지정하는 것은 임의 과정에 의한 것이라고 가정해도 무방함.

• 실험군에 속한 쥐들은 사카린이 5% 함유된 음식을 먹었고, 대조군에 속한 쥐들은 사카린이 포함되지 않은 같은 음식을 먹었음.

- (iv) 상대 빈도 관찰

• fx(E): 사카린 5%를 먹은 쥐들의 방광암 발생 상대 빈도

• fk(E): 사카린이 포함되지 않은 쥐들의 방광암 발생 상대 빈도

■ 임의 표집

- 임의화 실험 설계에서 임의 표집은 두 지점에서 일어남.

• (i) 피실험 대상의 표본은 반드시 전체 모집단에서 임의로 선택되어야 함.

• (ii) 최초의 표본을 실험군과 대조군으로 나누는 것도 반드시 임의적으로 이루어져야 함.

■ 인과적 가설의 평가

- 변수(1): 실험군과 대조군의 특징을 기술하는, 원인 변수(음식에 사카린이 포함되었는지 여부)

- 변수(2): 방광암의 발생 여부를 나타내는 결과 변수

- 변량 fx(E): x군에서 방광암이 발생한 상대 빈도

- 변량 fk(E): k군에서 방광암이 발생한 상대 빈도

- 질문: fx(E)와 fk(E) 사이에 통계적으로 유의한 차이가 있는가?

- 확인하는 방법: Px(E)와 Pk(E)의 값을 추정하기 위해 fx(E)와 fk(E)의 값을 이용한다.

• Px(E) = fx(E)±ME (ME: 오차 한계)

• Pk(E) = fk(E)±ME

- 구간들이 중복되지 않으면 fx(E)와 fk(E)의 차이는 통계적으로 유의함.

- 통계적으로 유의하다

= Px(E)와 Pk(E) 사이의 실제 차이에 대한 좋은 증거가 있다.

= 원인 변수와 결과 변수 사이의 인과 관계에 대한 좋은 증거가 있다.

- 그 구간들이 중복되면, fx(E)와 fk(E)의 차이는 통계적으로 유의하지 않다.

- 통계적으로 유의하지 않다

= Px(E)와 Pk(E) 사이의 실제 차이에 대해 좋은 증거가 없다.

= 원인 변수와 결과 변수 사이의 인과 관계에 대한 좋은 증거가 없다.

원인의 유효성을 추정하는 것

: Px(E)와 Pk(E)에 대한 추정된 구간들에서 가장 가까운 두 끝과 가장 먼 두 끝의 차이를 계산한다.

→ 해당 모집단에서 원인의 유효성에 대한 추정치

■ 인과적 가설의 평가를 위한 프로그램

(프로그램)

- 1단계: 실세계 모집단과 인과적 가설

• 표집된 모집단과 관심 대상인 모집단 사이의 어떤 차이가 있는가?

• 원인 변수와 결과 변수를 확인

• 평가할 인과적 가설을 진술

- 2단계: 표본 자료

• 표본 크기를 포함하여, 인과적 가설과의 유관성을 평가하고자 하는 자료를 확인

- 3단계: 실험 설계

• 실험 설계를 나타내는 모형을 확인하고, 그 모형을 선택한 이유를 설명

- 4단계: 임의 표집

• 임의 표집 모형이 모집단에서 표본이 실제로 선택되는 과정을 얼마나 잘 나타내는가?

• 가능한 답: (a) 매우 잘 나타낸다, (b) 적당히 잘 나타낸다, (c) 어느 정도 잘 나타낸다, (d) 별로 잘 나타내지 못한다 등

- 5단계: 가설의 평가

• 임의 표집 모형을 적용할 수 있다고 가정할 때,

• 1단계에서 진술된 인과적 가설에 대한 증거가 있는지 여부

• 가능하면 원인의 유효성을 추정할 것

- 6단계: 요약

• 자료가 5단계에서 언급된 인과적 가설을 얼마나 강하게 지지하는가를 간단히 요약

• 가능한 답: (a) 매우 강하지 지지한다, (b) 적당히 강하게 지지한다, (c) 어느 정도 강하게 지지한다, (d) 별로 강하게 지지하지 못한다 등

(제2세대 사카린 실험)

- 1단계: 실세계 모집단과 인과적 가설

• 표집된 모집단: 사육된 쥐

• 원인 변수: 사카린 섭취, 결과 변수: 방광암

• 가설: 실험용 쥐들의 모집단에서 사카린 섭취는 방광암을 일으키는 긍정적 원인이다.

- 2단계: 표본 자료

• 제2세대 암컷과 수컷을 포함한 전반적 자료에서

• 실험군: 방광암 발생율이 14/94(15%)

• 대조군: 방광암 발생율이 0/89(0%)

- 3단계: 실험 설계

• 이 실험은 임의화 실험 설계 모형이 들어맞는다.

• 모집단에서 선택된 표본은 임의적으로 두 집단으로 나누어졌고, 실험자들은 그 중 하나에 원인을 공급했다.

- 4단계: 임의 표집

• OTA가 검토한 전문적 연구였다 → 임의 선택 과정을 보장하기 위한 표준적인 과학적 방법이 채택되었음을 추측

• 임의 표집 모형에 매우 잘 들어맞는다.

- 5단계: 가설의 평가

• fx(E)와 fk(E)의 차이는 0.05 유의 수준에서 통계적으로 유의하다고 보고됨.

• fx(E)가 fk(E)보다 더 크다.

• 그러므로 수태되는 순간부터 사카린을 섭취하는 것은 쥐들에게 방광암이 일어나는 긍정적 원인이라는 좋은 증거가 있다.

• f(E)의 값이 작기 때문에 ... 원인의 유효성이 0보다 크다.

- 6단계: 요약

• 신뢰 수준을 99.7%까지 올려도 신뢰 구간이 중복되지 않기 때문에 fx(E)와 fk(E) 사이에서 관찰된 차이는 0.003 수준에서 통계적으로 유의하다.

• 이는 쥐에 대한 인과적 가설을 뒷받침하는 매우 강력한 증거이다.

• 이 결과를 인간에게 적용하는 것은 또 다른 문제이다.

[그림 8.4]

■ 쥐와 인간

- 동물 연구의 관련성의 문제

• 문제(1): 인간은 쥐와 다르다.

• 문제(2): 사용된 사카린의 양이 매우 많음. 인간이 먹는 음식의 5%는 다이어트 소다수 800병에 들어 있는 사카린의 양과 맞먹음.

- 둘 다 그럴듯하지 않은 비판임.

- 대부분의 환경 위험물질은 유효성이 그다지 높지 않음.

통상적인 복용량을 사용하여 낮은 효과를 탐지하려면 쥐 수천 마리를 실험에 동원해야 하는데, 이것이 불가능하므로 동물 수를 줄이고 복용량을 늘림.

- 이러한 전략의 가정은 효과가 나타나는 사례들의 수는 복용량에 비례한다는 것

- 질문: 결과가 나타나기 시작하는 문턱이 있지 않은가?

- 답변: 어떠한 생물학적 요소도 문턱을 가진다고 실제로 밝혀진 적이 거의 없음.

- 질문: 어떤 물질도 과다하게 복용하면 암을 일으키지 않는가?

- 답변: 많은 화학물질들을 다량 복용시키는 방식으로 동물실험을 함, 그러나 몇 가지 물질만이 암을 일으킴

- 질문: 인간은 쥐가 아니다.

- 답변: 인간에게 암을 일으키는 요소들은 실험용 쥐에게도 예외 없이 암을 일으킴. 복용량과 몸무게 차이를 고려하면, 쥐 94마리 중 14마리가 암에 걸린 것은, 하루에 다이어트 소다수 한 병 마신 2억 명 중 약 1,200명이 방광암에 걸리는 것에 해당한다. (600만분의 1)

8.3. 이중맹검 연구

이중맹검(double blind)

- “맹검적으로” 연구한다는 것은, 피험자가 자신이 실험군에 속하는지 대조군에 속하는지 분간할 수 없도록 연구하는 것

- 이유: 위약 효과를 피하기 위해서

• 자신이 실험군에 속한다는 것을 아는 동시에 연구 중인 원인 요소가 어떤 효과를 나타낸다고 믿는 것만으로도 분명한 효과가 나타날 가능성이 있기 때문

• 예) 사소한 통증을 겪는 환자들은 위약을 먹고 통증이 가라앉음.

- 이중맹검적이라는 것은, 진단을 하는 실험자들도 어떤 피험자가 어떤 군에 속하는지 전혀 알지 못하는 것

- 이중맹검이 필요한 이유: 실험자가 어떤 특정한 피험자가 어떤 군에 속하는지 알게 되면 경계선상에 있는 사례들을 개인적 편향에 유리한 방향으로 진단할 수 있어서

• 예) 가벼운 기침을 하는 경우를 감기 증상으로 진단할 것인가 여부

- 실험을 전반적으로 책임지는 사람은 어떤 피험자가 어떤 집단에 속하는지 기록한 명단을 가지고 있어야 하며, 그 사람은 피험자들에 대한 진단을 수행하면 안 됨.

8.4. 정신분열증과 유전

정신분열증은 “생물학적” 질병인가?

예) 도파민 가설: “정신분열증의 양성 증상(망상적 믿음, 환청 등)은 과잉 활동하는 도파민 방출 신경세포들에 의해 일어난다.”

정신분열증의 생물학적 원인에 대한 가장 강력한 증거는 그 병의 유전가능성에 있다.

- 입양에 대한 연구

연구 결과 생물학적 부모들과 입양된 정신분열증 환자들 사이에서 정신분열증의 발병률이 일반인들에서보다 더 높게 나타남.

즉, 유전적인 요소가 환경적 요소보다 정신분열중의 원인과 더 관련이 있음.

더욱 강력한 증거는 쌍둥이 연구를 통해 제공될 수 있음.

MZ 쌍둥이(일란성 쌍둥이)와 DZ 쌍둥이(이란성 쌍둥이)에 대한 환경의 영향이 충분히 같다고 가정한 상태에서, 두 쌍둥이 모두 정신분열증을 가지는 비율이 DZ 쌍둥이에서보다 MZ 쌍둥이에서 더 높다면 그러한 질환은 유전적 요소들에 기인한다고 말할 수 있음.

일치 비율을 계산하기 위한 두 가지 방법

(1) 쌍별 일치의 방법(pairwise concordance method)

(2) 발단자 일치의 방법(proband concordance method)

쌍별 일치의 방법

: 단순히 표본을 구성하는(일치하거나 불일치하는) 쌍들의 총수에 상대적으로 형질이나 장애가 일치하는 쌍들의 백분율을 계산함.

예) MZ 쌍둥이들의 표본에서 10쌍이 형질 X에 대해 일치하는 반면 40쌍이 불일치한다면 (그 표본에서 형질 X에 대한 MZ 쌍둥이의) 쌍대 일치 비율은 10/50(20%)이다.

발단자 일치의 방법

: 표본에 속하는 쌍의 두 구성원이 모두 해당 형질을 소유한다는 점이 독립적으로 확인될 경우, 그러한 쌍은 모두 두 번식 계산됨.

예) C1은 표본에 속하는 MZ 쌍둥이의 두 구성원이 모두 형질 X를 가진다는 것이 독립적으로 확인된 MZ 쌍둥이 쌍들의 수이고, C2는 형질 X에 대해서는 MZ 쌍둥이의 두 구성원이 일치하지만 그중 하나만 원래의 자료 수집 단계에서 X를 소유하는 것으로 확인된 MZ 쌍둥이 쌍들의 수라고 하자. 그러면 C1은 발단자 일치 쌍들의 수를 계산할 때뿐 아니라 쌍들 모두의 수를 계산할 때도 2배수로 계산된다.

MZ 쌍둥이들의 표본에서 10쌍이 형질 X에 대해 일치하는 반면 40쌍이 불일치하는데, 형질 X에 대해 일치하는 10쌍 중 5쌍의 구성원은 모두 연구의 자료 수집 단계에서 형질 X를 소유하는 것으로 확인된 반면, 다른 다섯의 일치하는 쌍의 경우 단지 하나의 구성원만 이 단계에서 X를 소유하는 것으로 확인되었다고 하자. 이 경우 발단자 일치의 비율은

이다

■ 최근에 출간된 쌍둥이 연구 결과 5종의 결합

(표는 나중에)

- 다섯 가지 실험에서 모두 MZ의 경우가 상대적으로 더 높은 발단자 일치 비율을 가짐.

- 칼데노와 고트만이 내린 결론: “결합된 표본 분석의 결과는 ... DSM-III-R과 ICD-10 진단 기준에 의해 정의된 정신불열증에 걸리기 쉬운 경향이 유전적 기여에 따라 달라진다는 결론을 보장하는 것 같다.”

- 정신분열증이 단 하나의 유전적 요소에 의해 산출되는 표현형적 형질인가?: 이 경우 그 요소가 우성이라면 부모 두 명이 모두 정신분열증인 부모가 낳는 이들 중 약 75%가 정신분열증을 앓을 것이고, 요소가 열성이라면 100%가 정신 분열증을 앓을 것이다.

- 하지만 실제 발병률은 50% 미만. 이는 여러 가지 유전적 요소들이 그 원인에 포함되어 있거나 유전된 어떤 물질이 그 병에 걸리기 쉬운 성질을 제공함을 의미한다.

고트만이 기술한 올바른 결론의 특성

정신분열증은 진성당뇨병과 관상동맥증이 유전병이라는 것과 같은 의미에서 유전병이다. 즉 가계, 쌍둥이, 질환이 있는 입양아에 대한 연구들로부터 유전적 역학의 전략을 통해 초기에 수집된 많은 증거는 병인들에서 유전적 요인들이 결정적이거나 치명적이지는 않지만 매우 강력한 역할을 한다는 것을 함축한다.

임상적으로 관찰가능한 질환의 개별 사례에서, 질환에 걸리기 쉬운 경향을 유발하는 문제의 함축된 유전적 요소들은 알려진 환경적 요소들뿐만 아니라 미지의 환경적 요소들과 부가적이거나 상호작용하는 방식으로 결합하여, 태아기, 주산기 또는 출생 후에 그 질환들 중 한 가지에 걸려 고통받는 사람이 생기도록 작용한다.

8.5. 전향적 설계

- 언급된 쌍둥이 연구 5종은 모두 전향적 설계를 사용했다: 두 군의 피험자들, 즉 의심되는 원인을 드러내는 군과 그렇지 않은 군을 이용하여 연구가 시작되지만 실험적 연구에서와는 달리, 이 연구에서 피험자들은 연구자들에 의해 두 군에 배정되지는 않는다. 연구자들은 대상을 이미 존재하는 두 부분모집단(MZ, DZ)에서 표집했을 뿐이다.

- 전향적 연구에서 사용되는 전략: 의심되는 원인을 제외한 모든 특성에서 평균적으로 비슷한 두 군을 확보한 다음, 결과의 빈도에서 통계적으로 유의한 차이가 나타나면, 그것은 인과적 가설에 대한 증거를 제공한다.

- 전향적 연구의 경우, 두 군이 인과적 가설에 대한 우리의 모형에서 설정되는 가정적 모집단에서 나온 표본이라고 볼 수 없다. 이는 전향적 연구와 임의화 실험 연구의 가장 큰 차이점이며, 이러한 이유로 전향적 연구는 인과적 가설을 직접적으로 검사할 수는 없다.

- 전향적 연구는 존재하는 실제 모집단에서 나온 표본을 토대로 한다는 점에서 오히려 상관에 대한 검사와 비슷하다. 그러나 전향적 연구는 단순히 공존하는 속성들을 조사하는 것이 아니라는 점에서 상관에 대한 조사와 다르다.

다른 변수들의 통제 – 전향적 연구의 가장 주요한 단점

: 실험자가 완벽하게 통제할 수 없는 연구 설계는 발견된 결과들에 대한 대안적인 설명을 배제할 수 없다는 문제가 있다.

- 쌍둥이 실험에서도 “동등한 환경 유사성”이라는 가정이 필요했다. 하지만 이러한 가정은 문제가 있다. 과연 “동일한 쌍둥이로 성장하는” 환경은 무엇을 의미하는가?

- MZ 쌍둥이의 경우 DZ쌍둥이나 일반적인 형제와는 다른 환경에서 자라며, 심지어 그러한 차이는 태아기의 환경으로 소급하여 확장될 수도 있다.

변수들의 통제가 필수적

: 한 가지 방식은 가정된 대안적 원인을 드러내지 않는 개인들로만 두 군을 구성하는 것이다.

예) 사춘기 동안에 DZ쌍둥이처럼 부모의 관심을 받거나 쌍둥이가 아닌 형제처럼 부모의 관심을 받은 MZ쌍둥이 쌍으로 제한하는 방식

- 형제처럼 부모의 관심을 받은 MZ쌍둥이 쌍으로 제한하는 방식

- 제한된 경우에도 유의한 차이가 남는 경우, 애초에 의심을 두었던 원인이나 어떤 다른 대안적 원인에 의해 차이가 발생한다.

- 제한된 후 유의한 차이가 사라지는 경우, 애초에 가정된 원인만의 효과가 전향적 연구를 통해 감지될 수 없다.

- 그러나 분명히 쌍둥이 연구는 이러한 통제가 실질적으로 매우 어렵다.

변수들의 통제가 필수적

: 두 번째 방식은 그 대안을 “원래의” 원인으로 간주하고 표집된 부분모집단을 그 원래 가정된 원인을 결여하는 쌍둥이 쌍들로 제한하는 것

예) 환경적 대안을 원인으로 간주하고, 부분모집단을 100% 동일한 유전물질을 결여하는 쌍둥이 쌍들로 제한

이 경우 결과에 유의한 차이가 나지 않을 경우, 대안적 원인이 전향적 설계를 통해 탐지될 수 없다는 것

-> 하지만 이러한 통제는 쌍둥이 연구에서는 이용될 수 없다.

- 이러한 대안적 원인의 통제는 표본 크기의 감소라는 대가를 치르게 한다.

- 전향적 연구의 설계자들은 의심이 가는 제3의 원인이 대조군에서 나타나는 빈도와 실험군에서 나타나는 빈도를 짝짓는 방식으로 작업을 진행한다. 왜냐하면 특정한 피험자들과 대조 피험자들이 표본에 포함되는 이유가 그들이 문제의 대안적 원인을 공유하는 것으로 알려졌기 때문이다.

- 하지만 표본들을 짝짓는 전략은 잠재적인 상호작용의 결과를 예방하지는 못한다. 대안적 원인들을 통제하는 전략들은 어떤 환경적 요소가, 실제로는 유전적 요소들과 상호작용할 경우에만 원인이 될 수 있음에도 불구하고, 단독으로 정신분열증에 대한 긍정적 원인이라고 제안하는 결과를 내놓을 수 있다.

- 다행히 최근에는 쌍둥이 연구에서 사용되는 방법론들과 통계적 분석 기법이 충분히 발전하여, 유전 및 환경 요소들이 특정한 형질이나 장애를 인과적으로 일으키는 양적인 범위를 잘 추정할 수 있게 되었다.

전향적 설계 vs. 임의화 실험 설계

- 임의화 실험 설계: 모집단의 구성원들이 가지는 모든 특성은 평균적으로 실험군과 대조군에서 짝짓기가 된다. 어떤 특정한 Q요소에 대해 짝짓기가 되지 않더라도 이 요소가 결과와 매우 유관한 것으로 드러나는 일은 거의 없다.

- 전향적 설계: 잠재적으로 유관한 다른 변수들이 통제되었다는 표시를 항상 찾아보아야 한다. 그러한 표시가 없다면 자료가 왜곡될 수도 있다.

- 따라서 임의화 실험 설계가 전향적 설계에 비해 인과적 가설에 대해 훨씬 더 좋은 증거를 제공하는 것으로 볼 수 있다.

전향적 설계 – 프로그램 적용

- 1단계: 실세계 모집단과 인과적 가설

• 관심의 대상인 모집단은 성인

• 실제로 표집된 모집단은 1930년과 1972년에 태어난 유럽과 일본에 거주하는 MZ 및 DZ쌍둥이들의 쌍으로 구성되었으며, 국립 출생률 데이터뱅크나 선택된 정신병원들의 입원기록들을 통하여 확인됨.

• 원인 변수: 유전을 통하여 전해지는 유전물질

• 결과 변수: 객관적이고 공유된 기준들(DSM-III-R 또는 ICD-10 진단)을 이용한 정신분열증 진단

• 평가될 인과적 가설: 유전성 유전물질이 표집된 MZ 및 DZ쌍둥이 쌍들에서 정신분열증에 대한 긍정적 원인이라는 것이다.

- 2단계: 표본 자료

• 표본은 유럽 4개국과 일본에서 임의로 선택한 MZ 및 DZ쌍둥이 쌍들로 구성되었다. 5종의 연구들에 대한 결합된 분석에는 MZ쌍둥이 180쌍과 DZ쌍둥이 174쌍이 포함되었다. 적어도 각 쌍 중 한 구성원은 공유된 객관적 기준들을 이용하여 정신분열증으로 진단받았다. 각 연구의 종반에 MZ쌍들 중 85/180(47%)가 정신분열증에 대해 쌍별 일치로 드러났다. DSM-III-R 진단 기준에 의하면 4/97(4%), ICD-10 진단 기준에 의하여 3/77(4%)로 드러났다.

- 3단계: 실험 설계

• 이 실험 설계는 전향적 모형에 들어맞는다. 이 설계는 실험군과 대조군이 임의로 구분되지 않았기 때문에 실험적이지 않다.

• 자연에 의해 피험자들은 MZ쌍둥이 쌍들의 범주와 DZ쌍둥이 쌍들의 범주 중 하나에 속하도록 “선택되었다”. 모든 피험자들은 출생시 결과에 해당하는 정신분열증 진단을 받지 않았다. 하나의 형질에 대한 일치 비율들을 평가하기 위해 쌍별 전략이 5종의 연구 모두에서 사용되었으며, 따라서 정신분열증을 평가할 때 각 쌍의 두 구성원은 독립적으로 다루어졌다.

• 공유된 객관적 기준들은 신빙성 있는 진단을 보증했고 몇 가지 잠재적인 평가 편향들을 배제했다.

• 그 연구 중 몇몇은 정신분열증 일치를 더 평가하기 위하여 후속 면접을 사용했다.

- 4단계: 임의 표집

• 이러한 분석으로 결합된 연구들 중 어떤 것도 유럽 4개국과 일본의 모든 성인들, 심지어 모든 MZ쌍둥이 및 DZ쌍둥이 쌍에 대한 임의 표본을 포함하지 않는다.

• 하나의 쌍은 적어도 그 구성원 중 한 명이 정신병원 입원기록의 국립 데이어 베이스 또는 특정한 정신병원들의 입원 기록에 나타날 경우에만 포함되었다. 그러나 자연에 의해 개인이 MZ 또는 DZ 부분모집단에 속하도록 “선택되는 것”은 적어도 이러한 연구의 목적상 임의적으로 보인다. 각 쌍은 그 구성원 중 한 명이 정신분열증을 앓기 이전에 두 가지 군, 즉 MZ쌍둥이 쌍과 DZ쌍둥이 쌍 중 하나에 속했다. 객관적이 아닌 진단 기준이나 한 구성원의 이른 사망 때문에 어떤 쌍을 배제하는 것 이외에 그 연구들에서 통제되는 다른 변수들에 대한 어떠한 언급도 없었다. 그러므로 임의 표집 모형의 요건들은, 이것들이 정신분열증과 같은 표현형 형질에 대한 쌍둥이 연구들에서 충족될 수 있는 정도로만, 부분적으로 충족되었다.

- 5단계: 가설의 평가

• 표본 빈도들의 관찰도니 범위 내에서, 180 및 174(쌍둥이 쌍들)의 표본들에 대한 오차 한계는 95%의 신뢰 구간에서 10%보다 커서는 안 된다. 그러므로 이 결합된 연구의 MZ쌍둥이 및 DZ쌍둥이 쌍들 사이에서 관찰되는 정신분열증에 대한 쌍별 일치 비율들의 차이는 통계적으로 유의하다. 그러므로 표집된 모집단들에서 유전물질이 정신분열증에 대한 긍정적 원인이라는 가설에 대한 좋은 증거가 있다. 우리의 단순한 간이 기법에 의하면 모집단의 유효성은 0.33과 0.61 사이의 범위에 있다고 추정된다. 그러나 그 방법은 심한 정신질환이나 일치하는 쌍들의 경우 선택 편향을 낳을 수 있기 때문에 정신병원 입원 자료에 의존하는 개별 쌍둥이 연구들에서 정신분열증에 대한 쌍별 일치 비율들을 상승할 수 있다. 관찰된 일치 비율들은 여전히 유의하다.

- 6단계: 요약

• 정신분열증의 유전적 원인에 대한 이러한 최근의 결합된 쌍둥이 연구들은 전향적 설계의 성공적인 예를 제공한다.

• 공유된 체계적인 진단 기준, 국립 쌍둥이 출생등록부, 후속 면접 등을 활용하고 표본들의 지리적 위치를 다양하게 선정한 것은 정신분열증에 대한 초기의 쌍둥이 연구들에 비해 중요한 진전이다. 동등한 환경 유사성 가정을 포함하여 쌍둥이 연구 방법론들에 대한 몇 가지 일반적인 우려들이 남아 있다.

• 그러나 MZ쌍둥이 및 DZ쌍둥이 쌍들 사이에 존재한다고 알려진, 그리고 정신분열증에 대해 잠재적 원인들이라고 인정되는 특정한 환경적 차이들이 있다는 징후가 없는 한, 이러한 회의적인 우려들은 처음과는 달리 수그러들 것이다. 유전물질이 정신분열증을 일으키는 중요한 원인이라는 가설을 지지하는 강한 증거가 있다.

8.6. 정신분열증의 병인과 유전자

- 쌍둥이 연구나 입양 연구는 어떤 표현형 형질이나 장애의 일반적인 유전적 원인들에 대한 강한 증거를 제공할 수는 있다. 그러나 특정한 유전자가 작용한다는 것을 확립하기 우해서는 다른 방법들이 필요하다.

- 정신분열증의 경우 유전 기법들을 사용함으로써 DTNBP1 유전자의 역할이 드러났다.

- 연구자들은 일곱 가지의 단일염기다형성(SNPs)을 조사했는데, 여기서 SNP라는 해당 모집단에서 유전체의 특정한 위치에서 가장 일반적인 염기의 발생 빈도가 99% 미만으로 추정될 경우 그 위치에서 자연적으로 발생하는 단일 염기(C, G, A, T)의 변화이다.

- P1578 SNP에 집중: P1578은 DTNBP1 유전자의 첫 번째 및 두 번째 축색돌기 사이에 위치하며 인간 모집단 내에서는 그 장소에서 가장 일반적인 염기인 시토신(C)이 티민(T)으로 대체된다.

- 백인 및 라틴 아메리카인의 결합 표본에서 대조자에 비해 환자의 경우 부 대립유전자 빈도가 증가했다.(정신분열증 환자만 단독으로 고려할 때와 정신분열증과 분열 정동 장애 환자를 함께 고려하는 경우 모두에서 증가한다.)

-> 따라서 DTNBP1 유전자가 정신분열증의 유전적 병인에서 유전적 병인에서 중요한 역할을 한다는데 의심의 여지가 없다는 결론을 내린다.

- 그러나 아프리카계 미국 흑인 환자들은 대조자들에 비해서 P1578 SNP의 빈도에서 비슷한 증가를 나타내지 않았다.

-> 연구자들은 그러한 결과가 불충분한 표본 크기 때문일 가능성이 많다고 말하면서도 DTNBP1 유전자가 이 인종 군에서는 정신분열증에 기여하지 않거나 그 기여도가 다른 모집단들에서보다 훨씬 미약할 수 있다는 점을 인정한다.

8.7. 후향적 설계

- 후향적 설계란?

: 이미 모두 결과를 나타낸 피험자들로 구성된 표본들에서 시작하여 의심이 가는 원인을 분리하기 위해 시간을 거슬러 조사하는 것

- 실험군의 비임의적 선택: 실험군은 원래 관심의 대상인 더 큰 모집단에서, 또한 실제 표집된 모집단에서도 임의로 선택되지 않았다. 언급된 정신분열증 연구는 미국 북동부에 소재한 하나의 주요 보건의료 시스템에 등록한 사람들에만 국한

-> 실제로 표집된 상대적으로 작은 모집단에서 관심의 대상인 더 일반적인 모집단으로 결론을 일반화하는 것은 문제가 있다.

- 대조군의 구성: 피험자들이 자신의 선택에 의해 결과를 나타내는 부분 모집단이나 결과를 나타내지 않는 부분 모집단에 속하도록 하면 의심이 가는 원인을 나타내는 피험자들의 비율과 연관된 방식으로 편향될 가능성이 있으므로 주의가 필요하다.

- 다른 변수들의 통제: 대조군을 구성하면서 짝 맞추기 된 변수들 이외에도 다른 변수들의 통제가 필요하다. 물론 이러한 통제는 표본 크기를 감수시키므로, 낮거나 중간 정도의 유효성을 가지면서 인과적으로 유관한 변수를 탐지할 기회가 줄어들게 된다.

- 모든 변수를 통제할 수는 없지만 실험 표본들과 대조 표본들 사이의 어떤 차이가 결과와 연관된다고 생각할 만한 이유가 존재하면 명백한 검사와 통제가 취해져야 한다.

- 후향적 설계의 경우, 두 가지 군들에서 관찰된 빈도들은 결과의 빈도가 아니라 원인의 빈도다. 마찬가지로 표본들을 추출한 부분모집단들은 의심이 가는 원인을 갖거나 갖지 않은 모집단이 아니라 결과를 나타내거나 나타내지 않는 모집단이다. (앞선 실험적 연구, 전향적 연구의 경우와는 반대)

- 후향적 연구와 조사 표집: 원칙적으로 후향적 연구에서 얻는 모든 정보는 조사 표집을 통해 얻을 수 있다. 그렇다면 왜 굳이 후향적 연구를 하는가?

-> 문제는 인원수. 만약 정신분열증 환자의 비율이 1/100이라면 정신분열증 환자 100명을 기대하기 위해서 1만 명의 표본이 필요하다.

후향적 설계는 보통 많은 잠재적 편향들에 직면한다.

- 무응답 편향

- 감시 편향: 때때로 가정된 원인을 가지는 개인들은 결과의 존재를 드러내는 활동에 참여하는 경향이 더 강하다.

예) 경구피임약의 장기 사용이 젊은 여성의 유방암에 대하여 약하지만 유의한 긍정적 원인이라는 주장과 관련한 유방암 연구에서 경구피임약을 복용한 여성들은 일반적으로 경구피임약을 복용하지 않은 여성들보다 더 규칙적인 의료 검사를 받았으며, 따라서 초기 단계에서 유방암이 탐지될 가능성이 더 높다.

-> DTNBP1 연구에는 적용되지 않는다. (환자들이 DTNBP1 SNP 변형을 가지기 때문에 정신과 의사를 만날 가능성이 높지는 않을 것이다.)

- 회상 편향: 특정 군에 속하는 피험자들이 자신의 회상을 편향시키는 것

예) 유방암 진단을 받은 여성들은 무의식적으로 그들이 실제로 복용한 것보다 더 오랫동안 경구피임약을 복용했다고 보고할 것이다.

-> DTNBP1에는 적용되지 않는다. (자신의 DTNBP1 유전자에서 SNPs 중 하나가 드러났는지를 회상하도록 요청받지 않는다.)

- 면접자 편향: 면접자들이 어떤 피험자가 어떤 결과를 가지는지, 또 대조자인지 알지 못하게 하는 일이 매우 어려울 때, 면접자들은 무의식적으로 피험자들의 반응을 의심이 가는 원인의 반향으로 편향되기 할 수 있다.

-> DTNBP1에는 적용되지 않는다. (면접자들은 오직 피험자가 환자인지 대조자인지 여부만 확인했다. 실질적인 병력과 진단 기록은 선임 의사 세 명으로 구성된 합의진단위원회가 다루었다.)

- 유효성과 후향적 연구

- 후향적 연구의 또 다른 단점: 후향적 연구에서 나오는 자료들은 그 자체만으로 어떤 원인의 유효성에 대한 추정을 제공하지 못한다. 왜냐하면 후향적 연구에서 제시되는 것은 결과가 나타난 군과 나타나지 않은 군에서 원인의 빈도이기 때문이다.

-> 이는 매우 심각한 문제가 되는데, 우리가 결정을 내려야할 때 가장 중요한 정보는 원인의 유효성에 있기 때문이다. 그러나 후향적 연구에서 얻은 정보를 다른 정보와 결합하면 유효성을 추정할 방법이 생기기도 한다.

후향적 연구에 대한 평가

- 표본의 생성과정이 부분적으로만 임의적, 또는 설사 임의 표집이 이루어진다고 해도 연구되는 변수들 사이에 전혀 인과적 연관이 없음에도 불구하고 표본군들에서 통계적으로 유의한 차이를 낳을 수 있는 상관이 모집단에 존재할 가능성이 있다.

- 기어리는 후향적 연구에 기반을 둔 결론이 자료를 통해 받는 지지가 기껏해야 중간 정도라고 생각하는 것이 좋을 것이라고 한다. 후향적 연구는 실험적 연구나 전향적 연구 같은 다른 형태의 연구를 착수할 좋은 이유를 제공할 수 있지만 단독으로 인과적 가설에 대한 좋은 증거를 제공한다고 보기는 힘들다는 것이다.

(프로그램 적용)

- 1단계: 실세계 모집단과 인과적 가설

• 관심의 대상인 모집단은 백인 및 라틴 아메리카인 성인들로 구성되었다. 실제로 표집된 모집단은 정신분열증과 분열정동성 장애 진단을 받은 백인 및 라틴아메리카인 환자들과 대조자들이다. 남성들과 여성들이 각각의 표본에 포함되었다. 모든 환자들은 미국 북동부 도시 지역에 소재한 주요 보건의료 시스템의 입원 환자 및 외래 환자들로 충원되었다. 이 모집단은, 비록 시골 지역에 살고 있거나 주요 의료보험을 제공받지 못하는 성인들을 대표하지는 못하지만, 미국 성인들을 대표한다고 보아야 한다.

• 원인 변수: DTNBP1 유전자

• 결과 변수: 정신분열증 또는 분열정동성 장애

• 고려 중인 주된 인과적 가설: DTNBP1 유전자에 의해 통제되는 활동이 백인 및 라틴 아ᅟᅦᆷ리카인 모집단에서 정신분열증에 대한 긍정적 원인이라는 것

- 2단계: 표본 자료

• 399명의 환자들과 618명의 표집된 대립유전자를 지닌 사람들 중 13%가 DTNBP1 유전자에서 P1578 SNP를 보유했다. 어떤 정신질환에도 걸리지 않은 499명의 대조자들과 998명의 표집된 대립유전자를 지닌 사람들 중 7%가 P1578 SNP를 보유했다. 환자들을 정신분열증 진단만을 받은 237명에 국한했을 때 표집된 474명의 대립유전자를 지닌 사람들 중 12%가 P1578 SNPs를 보유했다. 또한 그 연구는 DTNBP1 유전자에 있는 그 밖의 여섯 가지 SNPs에 대해서도 표집했는데, 그것들은 그 유전자가 정신분열증에서 행하는 인과적 역할에 대한 표지로 선행 연구들에서 제안되었다.

- 3단계: 실험 단계

• 이 연구의 설계는 후향적이다.

• 이러한 사실은 그 연구가 결과에 해당하는 정신분열증(또는 분열정동성 장애) 진단을 받은 성인들로만 구성된 실험군으로 시작했다는 점에서 나타난다. 정신분열증(또는 다른 주요 정신질환들)에 걸리지 않은 성인들로 구성된 대조군은 실험군의 구성원들이 가진 다른 특징들에 대해 짝 맞추기를 하는 방식으로 구성되었다.

- 4단계: 임의 표집

• 임의 표집은 이 연구에서 사용되지 않았다. 그러나 다른 잠재적으로 관련된 변수들이 미칠 수 있는 영향은 고려되었다. 환자들이나 대조자들 중 현재 약물을 남용하는 사람은 없으며, 대조자들은 본인이 주요한 정신적 장애의 병력을 가지고 있거나 직계 가족이 주요한 정신적 장애 진단을 받은 경우를 제외하기 위해 검사를 받았다. 환자들에 대한 합의 진단은 DSM-IV 진단 기준을 훈련받은 정신과 의사들의 위원회를 통하여 내려졌다. 가정된 원인의 표지들이 나타나는 빈도를 결정하는 데 정밀한 객관적 방법들을 사용함으로써 후향적 연구에서 일반적인 편향들이 제거되었다. 연구의 이러한 특징들은 설계에서 임의 표집이 결여되어 있음을 보완해준다. 그러므로 그것은 임의 표집 모형에 상당히 잘 들어맞을 것이다.

- 5단계: 가설의 평가

• 임의 표집 모형을 가정하면 환자들과 대조자들에게서 나타나는 DTNBP1 유전자에 있는 P1578 SNP의 빈도들 사이에는 통계적으로 유의한 차이가 있다. 간이 방법을 사용하더라도 618명의 표본에 대한 오차한계는 3-4% 사이에 있다. 반면에 998명의 표본에 대한 오차한계는 약 3%이다. 그러므로 그것들의 합은 대략 6-7% 사이에 있는데, 그 값은 빈도들의 차이인 6%와 거의 같다. 그러므로 임의 표집 모형에 따르면 이러한 결과는 DTNBP1 유전자가 백인 및 라틴아메리카인 모집단에서 정신분열증 또는 분열성동성 장애의 유전적 원인들로서 중요한 역할을 한다는 증거이다. 환자들의 표본을 정신분열증만 앓고 있는 것으로 진단받은 환자들에 국한해도, 비록 표본 크기는 줄어들지만, SNP의 관찰된 빈도들 사이의 차이는 약간 감소할 뿐이다. 후향적 연구에서 나온 자료를 이용해 유효성을 추정할 수는 없다.

- 6단계: 요약

• 이것은 후향적 연구이지만 훌륭한 경우이다. 환자들을 군으로 분류하고 환자들과 대조자들에서 가정적 원인을 검사하는 데 객관적 기준들이 시종 사용되었다. 이러한 기준들은 후향적 연구에서 일반적 유형의 편향들을 제거했다. 실험적 설계의 약점인 임의 표집의 부족을 보상하기 위한 조치가 취해졌다. 그러므로 특히 이 연구가 그것과 다른 설계들을 채용하는 최근의 많은 연구들과 결합할 경우 문제의 인과적 가설이 옳다는 것을 보여주는 상당히 강한 증거가 있다.

8.8. 인과적 가설을 위한 통계적 증거

전향적 연구는 인과적 연관을 증명하는가?

- 전향적 연구에서 과학자들은 친숙한 요소들만 통제한다. 또한 통제되는 변수가 많을수록 표본을 유지하기 어려워진다.

-> 이러한 문제들이 순전히 이론적 가능성에 그치는 경우들이 있다.

- 1960년대 미국립암연구소의 연구: 37,000명의 흡연자들을 나이, 인종, 키, 출생지, 거주지, 먼지, 연기, 증기, 화학물질, 방사능 등에 대한 직업상 노출, 종교, 교육, 결혼상태, 알코올음료 소비량, 일일 수면 시간, 평소 운동량, 신경의 긴장, 신경안정제의 사용, 현재 건강 상태, 피부암 이외의 암 병력, 심장병이나 발작 또는 고혈압 병력 등의 변수에 대해 짝 맞추기를 실행했다.

- 3년 후 조사 결과, 흡연자의 사망률이 비흡연자보다 2배 높았다. 심장병이 모든 사망 원인의 절반. 심장병으로 인한 사망률도 흡연자가 비흡연자보다 2배. 폐암으로 인한 사망률은 9배. 또한 흡연자의 사망률이 흡연 연수, 흡연량, 담배 연기의 흡입량에 비례. 흡연한 사람들이 금연한 경우 그 기간이 오래될수록 사망률이 감소했다.

-> 여전히 다른 요인이 작용했을 것이라고 보는 것은 매우 불합리해 보인다.

- 이러한 연구를 통해 우리는 전향적 연구에서 나온 통계적 자료가 인과 관계의 존재를 증명할 수 없다는 것이 기술적으로 맞다고 하더라도, 그러한 인과 관계가 있다는 결론을 의문시할 근거가 없을 정도로 매우 강력하다는 것을 알 수 있다.

실험적 설계의 윤리

: 임의화 실험 설계는 진정한 원인의 존재에 대한 최선의 증거를 제공해 주지만 윤리적 논쟁을 불러일으킬 수도 있음

- 예를 들어, 중한 질환에 대한 새로운 치료법을 검사할 때, 피험자들이 대조군에 들어갈 수 있는 기회는 50%이다. 만약 대조군에 들어가게 되면 그들은 자신들이 대조군에 속했다는 사실을 모른 채 덜 효과적인 다른 치료나 위약만을 제공받을 것이며, 이들은 새로운 치료의 기회를 갖지 못한다. 이러한 일이 윤리적으로 정당화될 수 있는가? 또한 증거가 부족한 상황에서 치료법을 승인하게 되면 병세를 더 악화시킬 수 있다.

생의학 연구의 새로운 동향

: 최근의 생의학적 지식들은 우리로 하여금 인과적 기제들에 개입하여 관찰 가능한 형질들에서 나타나는 결과를 추적하기 위한 새로운 실험 기법들을 제공한다.

예) 레스터 연구팀의 생쥐 연구

우리가 이러한 새로운 연구 동향에 관심을 가져야 할 이유

(1) 생의학 연구가 ‘가정된 인과적 기제’들에 대해 새포적, 분자적, 생화학적 수준에서 진행되고 있다. 따라서 이러한 낮은 수준에서의 실험들을 이해하는 것이 현재의 과학적 추론을 이해하는 데 도움이 될 것이다.

(2) 낮은 수준의 기제들에 대한 개입은 현저한 결과 값의 차이를 산출하기 때문에 상대적으로 작은 크기의 표본들이 통계적 유의성을 낳는데 사용될 수 있다.

8.9. 요약

후향적 연구 – 실험군과 대조군의 성격, 보고되는 백분율에 주목

그런 다음 임의 배정이나 위약 사용에 대한 지표를 찾아볼 것

(2021.12.31.)

.

2020/07/12

[과학철학] 기어리 외, 8장. “인과적 가설의 평가” 요약 정리 (미완성)

댓글 없음:

댓글 쓰기

[한국 가요] 소찬휘 (So Chanhwi)