수학 13

[메타코드 강의후기] 통계 기초의 모든 것 | 통계량(2)

분산(variance) : 편차 제곱의 합을 자료의 수로 나눈 값 왜 n이 아니라 n-1로 나누는걸까?통계량을 구하는 이유는 모수 추정이며 통계량은 최대한 모수에 가까워야한다.좋은 통계량을 구하는 기준 중 하나인 불편성(unbiasedness)는 편향이 없음을 의미한다.불편성을 만족하는 불편 통계량을 쓰는 공식이 위의 분산 공식이며 n-1로 나누는 이유이다.모집단에 대한 분산을 구할 경우에는 n-1이 아닌 n으로 나눈다. 표준편차(standard deviation) : 분산을 제곱근한 값표본 표준편차의 경우 n-1로 나누며, 모표준편차일 경우 n으로 나눈다.데이터 샘플링 후 표본 데이터에 대하여 통계량을 구하기 때문에 대부분의 경우에는n-1로 나누는것이 불편성이라는 성질을 만족하는 통계량을 생성한다.분산..

수학 2024.06.17

[메타코드 강의후기] 통계 기초의 모든것 | 통계량(1)

통계 : 데이터의 수집, 분석, 추론 요약 등의 방법론을 다루는 것design : 은 실험을 설계하는 것을 ex. 약품의 효과 실험의 통계description : 데이터를 통계적인 수치로 요약해서 그 정보를 제공하는 것 ex. 엑셀에서의 그래프 활용inference : 표본에 기반한 모집단에 대한 추론과 예측 모집단(population) : 통계학에서 관심/ 조사의 대상이 되는 개체의 전체 집합 모수(parameter) : 모집단에 대한 수치적 요약모수 예시 1: 고등학생의 1일 평균 온라인 게임 플레이 시간모수 예시 2: 강아지보다 고양이를 좋아하는 성인 비율 모수의 중요성: 모수만을 가지고 모수만으로도 모집단에 대한 디자인이 가능하다. 즉 모수에 대한 정보를 가지고 있으면 모집단에 대한 추론이 가능하..

수학 2024.06.17

빈도주의와 베이지안

확률 : 통계학적으로 한 사건이 장기적으로 일어날 때 발생하는 빈도빈도주의/베이지안은 확률을 해석하는 관점의 차이를 갖는다.빈도주의(Frequentist)얼만큼 빈번하게 특정한 사건이 반복되어 발생하는가를 관찰하고 가설을 세우고 모델을 만들어서 검증한다.확률은 장기적으로 일어나는 사건의 빈도!모수(parameter, 우리가 알아내고자 하는 값, 평균, 분산 등)는 우리가 모르는 고정된 상수!장점여러번의 실험, 관찰을 통해 알게된 사건의 확률을 검정하므로 사건이 독립적이고 반복적이며 정규분포형태일 때 사용하면 좋다.대용량 데이터를 처리할 수 있다면 계산이 비교적 복잡하지 않기 때문에 쉽게 처리 가능단점사전에 관찰지식이 없는 경우(데이터 부족으로 인한 결과가 적음) 실험 결과의 신뢰가 떨어짐데이터가 불확실하..

수학 2023.10.20