■ 자료의 종류
- 자료 형태에 따른 분류
• 양적 자료(quantitative data): 관측된 실수값들의 집합
• 질적 자료(qualitative data): 질적 특성에 근거하여 분류될 수 있는 관측값들의 집합
- 관측 방법에 따른 분류
• 횡단면 자료(cross section data): 관심 대상이 되는 특정 변수를 일정 시점에서 여러 개체별로 관측하여 만든 자료
• 시계열 자료(time series data): 관심 대상이 되는 특정 변수를 시간 순서에 따라 일정 기간 관측하여 만든 자료
• 패널자료(panel data): 관심 대상이 되는 특정 변수를 여러 개체별로 시간 순서에 따라 일정 기간 관측하여 만든 자료
■ 자료수집(Data Collecting) 방법
- 직접적인 관측
• 자료를 수집하는 가장 간단하고 편리한 방법은 연구 대상이 되는 변수를 직접 관측하는 것
• 단점: 일반적으로 정확한 자료를 제공하지 못함.
- 실험
• 특정 요인을 제외한 다른 요인들을 통제하면 유용한 정보를 얻을 수 있음.
• 단점: 많은 시간과 경비가 소요됨.
- 조사(Survey)
• 모집단의 특정 항목에 대한 정보를 얻기 위해 사용됨.
• 방문조사, 전화조사, 우편조사, 인터넷 조사 등
• 자료수집 대상에 따라 전수조사와 표본조사로 나눌 수 있음.
• 전수조사(population survey): 모집단(연구대상 전체)을 조사. 비용적・시간적 제약
• 표본조사(sample survey): 표본(모집단의 부분집합)을 조사
■ 표본추출(Sampling) 방법
- 표본추출 방법: 모집단으로부터 표본을 어떻게 추출할지에 대한 과정 또는 방법
• 일반적인 방법은 단순 임의 표본추출법과 층화 임의 추출법
- 단순 임의 표본추출법(Simple random sampling)
• 동일한 크기의 모든 가능한 표본들이 똑같은 확률로 선택될 수 있도록 표본을 추출하는 방법
- 층화 임의 추출법(Stratified random sampling)
• 모집단을 서로 배타적인 그룹으로 나누어서, 각 집단별로 임의 추출하여 표본을 만드는 방법
• 장점: 표본추출오차를 줄여 모집단에 대한 더 정확한 정보를 얻을 수 있음.
• 단점: 모집단에 대한 정확한 정보가 있어야 함. 비용이 많이 소요됨. 모집단을 집단별로 나누는 기준변수를 찾기가 어려움.
■ 표본추출 오차와 비-표본추출 오차
- 표본추출 오차(sampling error)
• 표본으로 추출된 자료값들에 의해 나타나는 모집단과 표본 사이의 차이
• 표본크기를 증가시킴으로써 오차를 줄일 수 있음.
- 비-표본추출 오차(non-sampling error)
• 표본추출 오차보다 더 심각한 문제를 일으킴.
• 데이터 수집과정에서 발생하는 실수나 부적절하게 선택된 표본자료값들로 인해 발생함.
■ 비-표본추출 오차의 유형
- 자료수집 과정의 오차
• 잘못된 자료 측정에 의한 오차, 관측된 자료를 기록하는 과정에서 발생되는 오차 등
- 무응답 오차
• 조사(survey) 과정에서 표본의 구성요소가 응답하지 못하거나 할 수 없기 때문에 발생되는 오차
• 표본이 모집단의 대표성을 상실하게 됨.
- 선택 편의(Selection bias)
• 표본을 수집하는 과정의 잘못으로 인해 모집단의 특정 집단이 선택에서 배제되어 발생하는 오차
■ 표본크기 결정
- 표본의 크기가 클수록 표본에 의한 추정이 더 정확해짐.
- 표본 크기(sample size)를 결정하는 방법은 추정과정에서 다시 논의
(2024.12.05.)
댓글 없음:
댓글 쓰기