2016/03/23

[경제통계학] 자료수집과 표본추출



■ 자료의 종류

- 자료 형태에 따른 분류

• 양적 자료(quantitative data): 관측된 실수값들의 집합

• 질적 자료(qualitative data): 질적 특성에 근거하여 분류될 수 있는 관측값들의 집합

- 관측 방법에 따른 분류

• 횡단면 자료(cross section data): 관심 대상이 되는 특정 변수를 일정 시점에서 여러 개체별로 관측하여 만든 자료

• 시계열 자료(time series data): 관심 대상이 되는 특정 변수를 시간 순서에 따라 일정 기간 관측하여 만든 자료

• 패널자료(panel data): 관심 대상이 되는 특정 변수를 여러 개체별로 시간 순서에 따라 일정 기간 관측하여 만든 자료

■ 자료수집(Data Collecting) 방법

- 직접적인 관측

• 자료를 수집하는 가장 간단하고 편리한 방법은 연구 대상이 되는 변수를 직접 관측하는 것

• 단점: 일반적으로 정확한 자료를 제공하지 못함.

- 실험

• 특정 요인을 제외한 다른 요인들을 통제하면 유용한 정보를 얻을 수 있음.

• 단점: 많은 시간과 경비가 소요됨.

- 조사(Survey)

• 모집단의 특정 항목에 대한 정보를 얻기 위해 사용됨.

• 방문조사, 전화조사, 우편조사, 인터넷 조사 등

• 자료수집 대상에 따라 전수조사와 표본조사로 나눌 수 있음.

• 전수조사(population survey): 모집단(연구대상 전체)을 조사. 비용적・시간적 제약

• 표본조사(sample survey): 표본(모집단의 부분집합)을 조사

■ 표본추출(Sampling) 방법

- 표본추출 방법: 모집단으로부터 표본을 어떻게 추출할지에 대한 과정 또는 방법

• 일반적인 방법은 단순 임의 표본추출법과 층화 임의 추출법

- 단순 임의 표본추출법(Simple random sampling)

• 동일한 크기의 모든 가능한 표본들이 똑같은 확률로 선택될 수 있도록 표본을 추출하는 방법

- 층화 임의 추출법(Stratified random sampling)

• 모집단을 서로 배타적인 그룹으로 나누어서, 각 집단별로 임의 추출하여 표본을 만드는 방법

• 장점: 표본추출오차를 줄여 모집단에 대한 더 정확한 정보를 얻을 수 있음.

• 단점: 모집단에 대한 정확한 정보가 있어야 함. 비용이 많이 소요됨. 모집단을 집단별로 나누는 기준변수를 찾기가 어려움.

■ 표본추출 오차와 비-표본추출 오차

- 표본추출 오차(sampling error)

• 표본으로 추출된 자료값들에 의해 나타나는 모집단과 표본 사이의 차이

• 표본크기를 증가시킴으로써 오차를 줄일 수 있음.

- 비-표본추출 오차(non-sampling error)

• 표본추출 오차보다 더 심각한 문제를 일으킴.

• 데이터 수집과정에서 발생하는 실수나 부적절하게 선택된 표본자료값들로 인해 발생함.

■ 비-표본추출 오차의 유형

- 자료수집 과정의 오차

• 잘못된 자료 측정에 의한 오차, 관측된 자료를 기록하는 과정에서 발생되는 오차 등

- 무응답 오차

• 조사(survey) 과정에서 표본의 구성요소가 응답하지 못하거나 할 수 없기 때문에 발생되는 오차

• 표본이 모집단의 대표성을 상실하게 됨.

- 선택 편의(Selection bias)

• 표본을 수집하는 과정의 잘못으로 인해 모집단의 특정 집단이 선택에서 배제되어 발생하는 오차

■ 표본크기 결정

- 표본의 크기가 클수록 표본에 의한 추정이 더 정확해짐.

- 표본 크기(sample size)를 결정하는 방법은 추정과정에서 다시 논의

(2024.12.05.)


댓글 없음:

댓글 쓰기

[외국 가요] 맥 드마르코 (Mac DeMarco)

Mac DeMarco - Heart To Heart ( www.youtube.com/watch?v=qBoQzo98EpQ ) ​ ​ (2025.01.20.)