■ 주요 개념
- 실험(experiment): 두 개 이상 결과 중에서 임의로 하나가 결정되는 과정
- 결과(outcome): 임의의 실험으로부터 나타나는 모든 사건들의 집합
→ 표본공간(sample space)
- 사건(event): 어떤 실험에서 나타난 개별결과
■ 예시
- 실험: 주사위 한 번 던지기
- 가능한 모든 결과들: {1, 2, 3, 4, 5, 6}
→ 표본공간(sample space)
- 가능한 사건
• 짝수가 나오는 사건: {2, 4, 6}
• 홀수가 나오는 사건: {1, 3, 5}
• 4보다 큰 수가 나오는 사건: {5, 6}
■ 확률의 개념
- 확률(probability): 미래에 발생할 수 있는 어떤 사건(event)의 가능성을 나타내는 것
- 확률의 값은 항상 0과 1 사이에 존재함.
• 확률값이 0에 가까울수록 사건이 발생할 가능성이 적어짐.
• 확률값이 1에 가까울수록 사건이 발생할 가능성이 많아짐.
- 임의의 결과(사건) A에 대한 확률값 P(A)를 정하는 세 가지 방법
• 고전적 방법(classical approach): 동일하게 발생하는 사건들(equally likely events)을 이용하여 결정함.
• 경험적 방법(empirical approach): 실험이나 과거의 자료를 이용하여 결정함.
• 주관적 방법(subjective approach): 연구자의 주관적 판단에 의해 결정함.
■ 고전적 방법
- 고전적 형태의 확률 = (특정 사건의 수/발생 가능한 모든 사건들의 수)
- 어떤 실험을 통해 “n”개의 결과가 가능하다면, 고전적 방법에서는 각 결과에 대해 (1/n)의 확률값을 가지게 됨.
→ 이 경우 모든 가능한 결과의 수를 결정해야 함.
- 예(1)
• 실험: 주사위 한 개 던지기
• 표본공간: {1, 2, 3, 4, 5, 6}
• 각 결과의 확률값: 각 경우의 수가 발생할 확률은 1/6, 즉, P(1) = P(2) = ... = P(6) = 1/6
- 예(2)
• 실험: 주사위 두 개를 던져서 나온 수의 합을 관찰
• 표본공간: {2, 3, …, 12}
• 각 사건들의 확률: P(2) = 1/36, P(6) = 5/36, P(10) = 3/36
- 어떤 사건이 다른 사건들과 동시에 발생할 수 없는 경우, 그 사건들은 서로 배타적(mutually exclusive)임.
- 어떤 사건의 발생이 다른 사건의 발생에 영향을 미치지 못하는 경우, 그 사건들은 서로 독립적(independent)임.
■ 경험적 방법
- 확률의 경험적 방법은 “대수의 법칙”에 근거함.
- 대수의 법칙(law of Large Numbers): 수많은 실험을 통해 어떤 사건의 경험적 확률은 실제 확률에 근접하게 됨.
- 경험적으로 확률을 결정하는 데 중요한 것은 많은 관찰(실험)을 통해서 더 정확한 확률값을 얻을 수 있다는 것임.
- 확률 = (특정 사건의 성공 횟수/전체 실험 횟수)
- 예: 동전 던지기에서 앞면(head)이 나올 확률
■ 주관적 방법
- 주관적 방법에 의한 확률은 주어진 정보를 토대로 어떤 사건의 발생 가능성에 대한 개인의 주관적 믿음의 정도를 나타냄.
- 예: 일기예보
• 일기예보는 기본적으로 예보자에 따라 다르게 나타날 수 있음.
• 기본적으로 예보자는 과거의 상황과 현재의 기상 조건을 토대로 주관적으로 판단함.
■ 확률에 대한 해석
- 확률을 결정하는 세 가지 방법들 중 어떤 방법을 이용하든 확률에 대한 해석은 경험적 방법을 토대로 이루어짐.
- 예: 고전적 방법을 통해 주사위를 1번 던져 1이 나올 확률이 1/6로 정해졌을 경우에도 이에 대한 해석은 경험적 방법에 의해 무수히 많은 실험을 통해 나타난 실제 확률로 해석함.
■ 여러 형태의 확률: 결합(joint), 한계(marginal), 조건부(conditional) 확률
- 여러 사건들이 다양한 형태로 결합된 사건들의 확률을 결정하는 방법
- 여러 사건들 간에 결합되는 형태들
• (1) 여사건(complement event)
• (2) 곱사건(intersection of events)
• (3) 합사건(union of events)
• (4) 배타적 사건(mutually exclusive events)
• (5) 종속사건(dependent events)과 독립사건(independent events)
■ 여사건
- 사건 A의 여사건은 사건 A에 포함되지 않은 모든 사건들의 합을 나타냄.
- 사건 A의 여사건은 “Aᶜ”로 표기함.
- P(A)+P(Aᶜ) = 1
- 예
• 실험: 주사위 두 번 던지기
• 표본공간: S = {(1, 1), (1, 2), …, (6, 6)} (36개)
• 사건 A: 두 수의 합이 7인 경우
사건 A: {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}
사건 A의 확률, P(A) = 7/36
사건 A의 여사건 확률, P(Aᶜ) = 1-(7/36) = 29/36
■ 곱사건
- 두 사건 A와 B의 곱사건은 A와 B에 모두 포함되는 사건들의 집합임.
- A와 B의 곱사건은 “A and B” 또는 “A∩B”로 표기
- 사건 A와 B의 결합확률(joint probability), P(A and B), P(A∩B)는 A와 B의 곱사건의 확률임.
- 곱사건과 결합확률의 예
• 주사위를 두 번 던졌을 경우, 표본공간 S = {(1,1), (1,2), ... , (6,6)} (총 36개)
• 첫 번째 수가 1일 경우를 A 사건이라고 하면,
A = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6)}
• 두 번째 수가 5일 경우를 B 사건이라고 하면,
B = {(1,5), (2,5), (3,5), (4,5), (5,5), (6,5)}
• A와 B의 곱사건, (A∩B) = {(1,5)}
• 결합확률 P(A∩B) = 1/36
■ 합사건
- 두 사건 A와 B의 합사건은 사건 A와 B 중 어느 하나 또는 모두에 포함되는 사건을 의미함.
- A와 B의 합사건은 “A or B” 또는 “A∪B”로 표기함.
- 합사건의 확률 P(A∪B) = P(A)+P(B)-P(A∩B)
- 예
• 주사위를 두 번 던졌을 경우, 표본공간 S = {(1,1), (1,2), ... , (6,6)} (총 36개)
• 첫 번째 수가 1일 경우를 A 사건이라 하면,
A = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6)},
• 두 번째 수가 5일 경우를 B사건이라 하면,
B = {(1,5), (2,5), (3,5), (4,5), (5,5), (6,5)}
• A와 B의 합사건 (A∪B) = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,5), (3,5), (4,5), (5,5), (6,5)}
• 합사건의 확률 P(A∪B) = (6/36)+(6/36)-(1/36) = 11/36
■ 상호배타적 사건
- 서로 다른 두 사건이 동시에 발생하지 않을 경우, 두 사건은 서로 배타적(mutually exclusive)임. 이 경우 결합확률은 0
- P(A∩B) = 0: A와 B는 서로 배타적임.
■ 결합확률표
- 동전을 두 번 던지는 실험을 했을 때, 첫 번째 던지기를 실험 A, 두 번째 던지기를 실험 B라고 하자.
- 실험 A에서 앞면이 나오는 경우(사건): A1, 뒷면이 나오는 경우(사건)을 A2
- 실험 B에서 앞면이 나오는 경우(사건): B1, 뒷면이 나오는 경우(사건)을 B2
- 서로 다른 네 가지 사건(A1, A2/B1, B2)들 사이에 나타낸 결합확률(joint probability)은 다음과 같음.
- 각 확률은 두 사건의 결합확률임: P(A₂ and B₁) = 1/4
- 한계확률(Marginal Probability)은 결합확률표의 행(rows) 또는 열(columns)의 합으로 나타남.
• P(A₂) = 1/4+1/4
• P(B₁) = 1/4+1/4
- 항상 한계확률의 합은 1임.
■ 조건부 확률
- 조건부 확률(Conditional probability)은 서로 다른 두 사건이 어떻게 관련되는지를 파악하는 데 이용됨.
• 다른 관련된 사건의 발생 조건하에서 한 사건의 발생확률을 나타냄.
- 조건부 확률은 P(A|B)로 표기함.
- 선행사건에 따라 조건부 확률은 달라질 수 있음.
- 예: 펀드 매니저가 상위 10위권의 MBA 프로그램을 졸업한 경우 펀드 수익률이 시장평균 수익률보다 높을 확률은?
• A₁: 상위 10위권의 MBA 프로그램을 졸업한 펀드 매니저
• A₂: 상위 10위권의 MBA 프로그램을 졸업한 펀드 매니저
• B₁: 펀드 수익률이 시장평균수익률보다 높은 경우
• B₂: 펀드 수익률이 시장평균수익률보다 낮은 경우
P(B₁|A₁) = P(A₁ and B₁)/P(A₁) = 0.11/0.40 = .275
- 따라서, 상위 10위권 MBA를 졸업한 펀드매니저들 중 펀드 수익률이 시장 평균 수익률보다 높은 경우의 확률은 27.5%임.
■ 독립성(independence)
- 조건부 확률을 구하는 목적들 중 하나는 두 사건의 관련성을 파악하기 위함임.
• 특히, 두 사건이 서로 독립적인(independent) 관계인지를 파악하기 위해 이용됨.
- 독립적인 관계: 한 사건의 확률이 다른 사건의 발생에 의해 영향을 받지 않는 관계
- P(A|B) = P(A) or P(B|A) = P(B)이 성립하면, 두 사건 A와 B는 서로 독립적 관계라고 할 수 있음.
- 예: 두 사건 A1과 B1은 서로 독립적인가?
• P(B₁) = 0.17
• P(B₁|A₁) = P(A₁ and B₁)/P(A₁) = 0.11/0.40 = .275
• P(B₁|A₁) ≠ P(B₁)이므로 B₁과 A₁은 서로 독립적인 사건이 아님.
• 두 사건은 서로 종속적(dependent)임. 한 사건(B₁)의 확률이 다른 사건(A₁)의 발생으로 인해 영향을 받음.
■ 확률의 곱의 연산
- 곱의 연산(multiplication rule)은 조건부 확률에 근거하여 두 사건의 결합확률 계산에 사용됨.
P(A|B) = P(A and B)/P(B)
- 따라서, P(A and B) = P(A|B) • P(B)
- 같은 형태로, P(A and B) = P(B|A) • P(A)
- 두 사건 A와 B가 서로 독립적이면, P(A and B) = P(A) • P(B)
■ 확률의 합의 연산
- 합의 연산(addition rule)은 두 사건A, B의 합사건(union of events)의 확률을 구하는 데 이용됨.
• P(A or B) = P(A)+P(B)-P(A and B)
■ 전확률정리
- 한 표본공간 S에 관해 k개의 사건 A₁, A₂, ... , Aₖ가 있을 때 이는 두 조건을 만족함.
• 조건(1): S = A₁∪A₂∪…∪Aₖ
• 조건(2): Ai ∩ Aj = 𝛷, i ≠ j
- 이 때 B라는 사건에 대해,
P(B) = P(A₁)P(B|A₁)+P(A₂)P(B|A₂)+…… +P(Aₖ)P(B|Aₖ)
■ Bayes의 정리(Bayes’ Theorem)
- 베이지안 이론(Bayesian theory)은 의사결정 과정이나 사건들의 관계를 분석하기 위해 널리 활용됨.
• 사전적 확률(prior probability) 정보를 이용하여 사후적 확률(posterior probability)을 예측하는 이론임.
• 베이지안 이론 베이즈 정리(Bayes theorem)에 기초함.
- 표본공간 S에 관해 k개의 사건 A₁, A₂, … , Aₖ가 있을 때 이는 두 조건을 만족함.
• 조건(1): S = A₁∪A₂∪…∪Aₖ
• 조건(2): Ai ∩ Aj = 𝛷, i ≠ j

- 예: TV 조립공장에 생산라인이 세 개 있고, 임의로 불량품을 골랐을 때, 이것이 생산라인1에서 생산한 TV일 확률은?
• 생산라인1: 50% 생산, 6% 불량품
• 생산라인2: 30% 생산, 3% 불량품
• 생산라인3: 20% 생산, 2% 불량품
- 답
• A1: 생산라인1의 상품을 고를 사건
• A2: 생산라인2의 상품을 고를 사건
• A3: 생산라인3의 상품을 고를 사건
• B: 불량품을 고를 사건

(2025.02.23.)
댓글 없음:
댓글 쓰기