통계 : 데이터의 수집, 분석, 추론 요약 등의 방법론을 다루는 것
design : 은 실험을 설계하는 것을 ex. 약품의 효과 실험의 통계
description : 데이터를 통계적인 수치로 요약해서 그 정보를 제공하는 것 ex. 엑셀에서의 그래프 활용
inference : 표본에 기반한 모집단에 대한 추론과 예측
모집단(population) : 통계학에서 관심/ 조사의 대상이 되는 개체의 전체 집합
모수(parameter) : 모집단에 대한 수치적 요약
모수 예시 1: 고등학생의 1일 평균 온라인 게임 플레이 시간
모수 예시 2: 강아지보다 고양이를 좋아하는 성인 비율
모수의 중요성
: 모수만을 가지고 모수만으로도 모집단에 대한 디자인이 가능하다. 즉 모수에 대한 정보를 가지고 있으면 모집단에 대한 추론이 가능하다.
표본(sample) : 모집단을 적절히 대표하는 모집단의 일부
통계량(statistic) : 표본에 대한 수치적 요약
통계량 예시 1 : 고등학생 1000명의 1일 평균 온라인 게임 플레이 시간
통계량 예시 2 : 강아지보다 고양이를 좋아하는 성인의 비율(1000명)
sample statistic -> population parameter
: 표본의 통계량을 통해 모집단의 모수를 추론하고 파악하는 것이 통계의 기본 흐름이다.
종류를 기반으로 통계적인 분석을 하는 방향을 잡을 수 있기 때문에 자료의 속성과 종류를 파악하는 것이 매우 중요하다.
범주형 자료 : 속성의 범주화, 상대적 서열 표현
명목형 자료 : 단순히 속성만 분류하는 자료(혈액형, 학급)
순서형 자료 : 명목형 자료에 서열을 주입한 형태로 상대적인 크기를 비교하는 자료(최종학력, 학업 성취도, 수업 평점)
양적 자료 : 자료자체가 숫자로 표현
이산형 자료 : 셀 수 있는 것(빈도 수, 불량품의 수)
연속형 자료 : 셀 수 없는 것(길이, 시간)
*길이, 시간은 구간별로 구획했기 때문에 셀 수 있는 것이다. 숫자가 커지는 것이 무한하기 때문에 셀 수 없는 존재이다.
종류를 기반으로 통계적인 분석을 하는 방향을 잡을 수 있기 때문에 자료의 속성과 종류를 파악하는 것이 매우 중요하다.
최빈값(mode) : 발생빈도가 가장 높은 값
극단값에 영향을 받지 않는 통계량
주로 범주형 자료에 대한 대표값
2개 이상 존재 가능
중앙값(median) : 크기 순으로 정렬된 자료에서 가운데에 위치하는 값
관측값 변화에 민감하지 않은 통계량
극단값에 영향을 받지 않는 통계량
극단값은 평균 계산에 영향을 주는 요인이기 때문에
극단값이 존재하는 경우 평균보다는 중앙값을 사용하는 것이 적합한 중심 통계량을 얻을 수 있다.
값의 개수가 짝수일 경우 가운데에 있는 값 두개를 평균내어 산출
예시)
1 2 3 4 5 6 7 8 9 의 중앙값 : 5
1 2 3 4 5 6 7 8 9 10 의 중앙값 : 5.5
산술평균(arithmetic mean) : 모든 자료의 값을 더하여 자료의 수로 나누어 준 값
모든 값을 반영하므로 극단값에 영향을 받음
가중평균(weighted mean) : 자료의 중요성이 각기 다를 경우 중요도에 따라 가중치를 부여한 평균
-> 각 자료의 각 중요도를 곱해서 모두 더한 후 가중치의 합으로 나누어 준다.
기하평균(geometric mean) : 자료가 성장률, 증가율 등 앞 시점에 대한 비율로 나타난 경우 유용한 통계량
음수가 아닌 자료값만 !
1번 문제
1반을 A로 , 2반을 B로 두 반 전체의 평균을 C로 가정
$A = 70 = \frac{\sum x_a}{30}$
$B = 80 = \frac{\sum x_b}{50}$
$C = \frac{\sum x_a + \sum x_b}{30 + 50}$
$\sum x_a = 2100, \sum x_b = 4000$
$C = \frac{2100 + 4000}{30 + 50} = 76.25$
2번 문제
$\frac{3*4.5+2*3.0+4*2.5+2*3.0}{3+2+4+2}$
위 내용은 메타코드 "통계 기초의 모든것 올인원"강의의 1편 1강 : 통계량의 "인사/데이터의 종류 소개" 및 "중심"의 요약 내용입니다.
아래 링크를 통해 통계 기초 강의 수강이 가능합니다.
https://metacodes.co.kr/edu/read2.nx?M2_IDX=31635&EP_IDX=8382&EM_IDX=8208
메타코드 사이트 내에서 통계 기초뿐만 아니라 다양한 강의 수강이 가능하며 다양한 이벤트 참여와 현직자 특강 수강이 가능합니다.
해당 게시물은 서포터즈 지원을 받아 작성하였습니다.
'수학' 카테고리의 다른 글
[메타코드 강의후기] 통계 기초의 모든것 | 확률과 확률변수(3) (1) | 2024.07.01 |
---|---|
[메타코드 강의후기] 통계 기초의 모든것 | 확률과 확률변수(2) (0) | 2024.06.23 |
[메타코드 강의후기] 통계 기초의 모든것 | 확률과 확률변수(1) (0) | 2024.06.20 |
[메타코드 강의후기] 통계 기초의 모든 것 | 통계량(2) (1) | 2024.06.17 |
빈도주의와 베이지안 (0) | 2023.10.20 |