수학

[메타코드 강의후기] 통계 기초의 모든것 | 통계량(1)

inthyes 2024. 6. 17. 00:09

 

통계 : 데이터의 수집, 분석, 추론 요약 등의 방법론을 다루는 것

design : 은 실험을 설계하는 것을 ex. 약품의 효과 실험의 통계

description : 데이터를 통계적인 수치로 요약해서 그 정보를 제공하는 것 ex. 엑셀에서의 그래프 활용

inference : 표본에 기반한 모집단에 대한 추론과 예측

 

모집단(population) : 통계학에서 관심/ 조사의 대상이 되는 개체의 전체 집합

 

모수(parameter) : 모집단에 대한 수치적 요약

모수 예시 1: 고등학생의 1일 평균 온라인 게임 플레이 시간

모수 예시 2: 강아지보다 고양이를 좋아하는 성인 비율

 

모수의 중요성

: 모수만을 가지고 모수만으로도 모집단에 대한 디자인이 가능하다. 즉 모수에 대한 정보를 가지고 있으면 모집단에 대한 추론이 가능하다.

 

표본(sample) : 모집단을 적절히 대표하는 모집단의 일부

 

통계량(statistic) : 표본에 대한 수치적 요약

통계량 예시 1 : 고등학생 1000명의 1일 평균 온라인 게임 플레이 시간

통계량 예시 2 : 강아지보다 고양이를 좋아하는 성인의 비율(1000명)

sample statistic -> population parameter

: 표본의 통계량을 통해 모집단의 모수를 추론하고 파악하는 것이 통계의 기본 흐름이다.

 

종류를 기반으로 통계적인 분석을 하는 방향을 잡을 수 있기 때문에 자료의 속성과 종류를 파악하는 것이 매우 중요하다.

범주형 자료 : 속성의 범주화, 상대적 서열 표현

명목형 자료 : 단순히 속성만 분류하는 자료(혈액형, 학급)

순서형 자료 : 명목형 자료에 서열을 주입한 형태로 상대적인 크기를 비교하는 자료(최종학력, 학업 성취도, 수업 평점)

 

양적 자료 : 자료자체가 숫자로 표현

이산형 자료 : 셀 수 있는 것(빈도 수, 불량품의 수)

연속형 자료 : 셀 수 없는 것(길이, 시간)

    *길이, 시간은 구간별로 구획했기 때문에 셀 수 있는 것이다. 숫자가 커지는 것이 무한하기 때문에 셀 수 없는 존재이다.

 

종류를 기반으로 통계적인 분석을 하는 방향을 잡을 수 있기 때문에 자료의 속성과 종류를 파악하는 것이 매우 중요하다.

 

최빈값(mode) : 발생빈도가 가장 높은 값

극단값에 영향을 받지 않는 통계량

주로 범주형 자료에 대한 대표값

2개 이상 존재 가능

중앙값(median) : 크기 순으로 정렬된 자료에서 가운데에 위치하는 값

관측값 변화에 민감하지 않은 통계량

극단값에 영향을 받지 않는 통계량

 

극단값은 평균 계산에 영향을 주는 요인이기 때문에

극단값이 존재하는 경우 평균보다는 중앙값을 사용하는 것이 적합한 중심 통계량을 얻을 수 있다.

 

값의 개수가 짝수일 경우 가운데에 있는 값 두개를 평균내어 산출

예시)

1 2 3 4 5 6 7 8 9 의 중앙값 : 5

1 2 3 4 5 6 7 8 9 10 의 중앙값 : 5.5

 

산술평균(arithmetic mean) : 모든 자료의 값을 더하여 자료의 수로 나누어 준 값

모든 값을 반영하므로 극단값에 영향을 받음

 

가중평균(weighted mean) : 자료의 중요성이 각기 다를 경우 중요도에 따라 가중치를 부여한 평균

-> 각 자료의 각 중요도를 곱해서 모두 더한 후 가중치의 합으로 나누어 준다.

기하평균(geometric mean) : 자료가 성장률, 증가율 등 앞 시점에 대한 비율로 나타난 경우 유용한 통계량

음수가 아닌 자료값만 !

1번 문제

1반을 A로 , 2반을 B로 두 반 전체의 평균을 C로 가정

$A = 70 = \frac{\sum x_a}{30}$ 

$B = 80 = \frac{\sum x_b}{50}$ 

$C = \frac{\sum x_a + \sum x_b}{30 + 50}$ 

 

$\sum x_a = 2100, \sum x_b = 4000$

$C = \frac{2100 + 4000}{30 + 50} = 76.25$ 

 

2번 문제

$\frac{3*4.5+2*3.0+4*2.5+2*3.0}{3+2+4+2}$


위 내용은 메타코드 "통계 기초의 모든것 올인원"강의의 1편 1강 : 통계량의 "인사/데이터의 종류 소개" 및 "중심"의 요약 내용입니다.

아래 링크를 통해 통계 기초 강의 수강이 가능합니다.

 

https://metacodes.co.kr/edu/read2.nx?M2_IDX=31635&EP_IDX=8382&EM_IDX=8208

 

통계 기초의 모든것 올인원 [ 1편, 2편 ]ㅣ18만 조회수 검증

 

metacodes.co.kr

 

메타코드 사이트 내에서 통계 기초뿐만 아니라 다양한 강의 수강이 가능하며 다양한 이벤트 참여와 현직자 특강 수강이 가능합니다.


해당 게시물은 서포터즈 지원을 받아 작성하였습니다.