확률은 불확실한 상황에서 의사결정을 하는데에 유용한 개념이다.
우연한 사건의 결과를 관찰하는 과정을 "확률 실험" , 관찰이나 실험을 통해 얻어지는 결과나 사건을 "사상(event)" 이라고 한다.
확률은 크게 객관적 방법과 주관적 방법이 있다.
객관적 방법에는 경험적 방법과 추론적 방법이 있다.
경험적 방법 : 직접 다 경험해보고 나온 결론이다.
ex ) 여러가지 색깔의 구슬이 들어있는 구슬 주머니에서 100회 뽑기 했는데, 노란색 구슬이 50번 나왔다면 노란색 구슬이 나올 확률은 50% 이다.
논리적 추론에 의한 확률의 정의 : 실험하지 않고 추론을 통해서 얻는 결론이다.
ex ) 동전 앞면이 나올 확률, 주사위 눈금이 1이 나올 확률 등이 있다.
<확률의 공리>
1. 어떤 사건 A가 일어날 확률은 0 ≤ P(A) ≤ 1
2. 표본공간 S에 대하여 P(S) = 1
3. 상호 배타적인 사상 A,B에 대하여 P(A∪B) = P(A) + P(B)
* 상호 배타적 : 교집합이 없는 것.
<확률의 덧셈 법칙>
1. 상호 배타적인 경우 : P(A∪B) = P(A) + P(B)
2. 상호 배타적이지 않은 경우 : P(A∪B) = P(A) + P(B) - P(A∩B)
<확률의 곱셈 법칙>
1. 상호 독립적인 경우 : P(A∩B) = P(A) * P(B)
2. 상호 독립적이지 않은 경우
- P(A∣B) = P(B) * P(A∣B)
- P(B∣A) = P(A) * P(B∣A)
- 즉, P(A∣B) ≠ P(B∣A)
확률 변수
- 확률 실험을 통해 나타나는 사상을 기초하여 실수값으로 다시 정의한 것으로, 각 값이 확률로 나타낼 수 있는 변수 이다.
확률 분포
- 표본 공간에 나타나는 확률변수가 취할 수 있는 모든 값들과 그 값에 대응하는 확률을 동시에 표시한 것.
- 이산 확률 분포, 연속 확률 분포
<확률분포의 기대값(평균)>
a,b 는 상수, X,Y는 확률 변수
- E(a) = a
- E(aX) = aE(X)
- E(aX+b) = aE(X)+b
- E(X+Y) = E(X)+E(Y)
- E(X*Y) = E(X) * E(Y) (단, X와 Y는 상호 독립)
<확률분포의 분산>
평균에서 떨어진 정도를 제곱한 값을 다시 산술평균한 값.
a,b 는 상수, X,Y는 확률 변수
- Var(a) = 0
- Var(aX) = a²Var(X)
- Var(aX+b) = a²Var(X)
- Var(X+Y) = Var(X) + Var(Y)
이항 분포, 베르누이 시행, 시행횟수와 성공확률에 의해 변화된다.
시행횟수가 많아질수록 오른꼬리 그래프에서 정규분포 모양(좌우대칭)을 띄게 된다.
포아송 분포
- 단위 구간에서 발생하는 성공 횟수에 대한 확률분포이다.
- 이항분포의 평균만 알고 있는 경우, n이 아주크거나, P가 너무 작은 경우 사용한다.
정규 분포
- 어떤 경험적 현상의 실제 측정결과로부터 얻은 확률 분포가 아니라 이론적으로 유도된 수학적 공식이다.
- 평균과 분산에 의해 형태가 결정된다.
참고문헌
정건섭, 김성우, R과 R Studio를 활용한 사회과학 통계연습, 윤성사, 2019
감사합니다.
'R' 카테고리의 다른 글
R언어 공부 - 확률과 확률분포 실습 (0) | 2023.07.14 |
---|---|
R언어 공부 - 자료의 정리 (2) (0) | 2023.07.05 |
R언어 공부 - 자료의 정리 (1) (0) | 2023.07.05 |
R언어 공부 - 통계 기본 이론 (0) | 2023.07.05 |
R언어 공부 - 스크립트 (0) | 2023.07.03 |