확률 : 통계학적으로 한 사건이 장기적으로 일어날 때 발생하는 빈도
빈도주의/베이지안은 확률을 해석하는 관점의 차이를 갖는다.
빈도주의(Frequentist)
얼만큼 빈번하게 특정한 사건이 반복되어 발생하는가를 관찰하고 가설을 세우고 모델을 만들어서 검증한다.
확률은 장기적으로 일어나는 사건의 빈도!
모수(parameter, 우리가 알아내고자 하는 값, 평균, 분산 등)는 우리가 모르는 고정된 상수!
장점
- 여러번의 실험, 관찰을 통해 알게된 사건의 확률을 검정하므로 사건이 독립적이고 반복적이며 정규분포형태일 때 사용하면 좋다.
- 대용량 데이터를 처리할 수 있다면 계산이 비교적 복잡하지 않기 때문에 쉽게 처리 가능
단점
- 사전에 관찰지식이 없는 경우(데이터 부족으로 인한 결과가 적음) 실험 결과의 신뢰가 떨어짐
- 데이터가 불확실하거나 부족하면 결과가 불확실함
베이지안(Bayesian)
고정된 데이터의 관점에서 파라미터에 대한 신념의 변화를 분석
확률은 사건 발생에 대한 믿음 또는 척도!
모수는 확률적으로 변하는 수 즉 확률변수!
사전지식의 확실성/불확실성과 관련있음
수학적 배경이 까다롭고, 계산량이 많아 구현의 어려움이 있지만 컴퓨터의 연산 능력확장과 다양하 ㄴ알고리즘 개발로 인해 통계/머신러닝에서 많이 사용됨
장점
- 확률 모델이 명확히 설정되어 있을 경우 조건부로 가설을 검증하기 때문에 가설의 타당성이 높아짐
단점
- 사전지식에 대한 모델링이 어렵고 사전지식 모델링에 따른 사후 확률결과가 크게 달라질 수 있다.
예시
동전을 던졌을 때 앞/뒷면이 나오는 사건의 확률에 대하여
빈도주의 - 동전을 던져 앞면이 나오는 사건의 ‘확률’은 0.5
베이지안 - 앞면이 나왔다는 주장의 신뢰도가 0.5
일어나지 않은 일에 대한 확률의 불확실성의 개념과 사건과 관련있는 여러 확률을 이용해 새롭게 일어날 사건을 추정하는것이 베이지안이다.
'수학' 카테고리의 다른 글
[메타코드 강의후기] 통계 기초의 모든것 | 확률과 확률변수(3) (1) | 2024.07.01 |
---|---|
[메타코드 강의후기] 통계 기초의 모든것 | 확률과 확률변수(2) (0) | 2024.06.23 |
[메타코드 강의후기] 통계 기초의 모든것 | 확률과 확률변수(1) (0) | 2024.06.20 |
[메타코드 강의후기] 통계 기초의 모든 것 | 통계량(2) (1) | 2024.06.17 |
[메타코드 강의후기] 통계 기초의 모든것 | 통계량(1) (0) | 2024.06.17 |