딥러닝파이토치교과서 2

[ML] 3. 머신 러닝 핵심 알고리즘: 비지도학습

3.2 비지도학습비지도 학습 : 레이블이 필요하지 않으며 정답이 없는 상태에서 훈련시키는 방식 비지도 학습에는 군집(clustering)과 차원 축소(dimensionality reduction)가 있다.군집은 각 데이터의 유사성(거리)을 측정한 후 유사성이 높은(거리가 짧은) 데이터끼리 집단으로 분류하는 것이다.차원 축소는 차원을 나타내는 특성을 줄여서 데이터를 줄이는 방식이다. 구분군집차원 축소목표데이터 그룹화데이터 간소화주요 알고리즘K-평균 군집화(K-Means)주성분 분석(PCA)예시사용자의 관심사에 따라 그룹화하여 마케팅에 활용데이터 압축중요한 속성 도출3.2.1 K-평균 군집화왜 사용할까?→ 주어진 데이터에 대한 군집화 언제 사용하면 좋을까?→ 주어진 데이터셋을 이용하여 몇 개의 클러스터를 ..

[ML] 3. 머신 러닝 핵심 알고리즘: 지도학습

3.1 지도학습지도 학습 : 정답을 컴퓨터에 미리 알려주고 데이터를 학습시키는 방법구분분류회귀데이터 유형이산형 데이터연속성 데이터결과훈련 데이터의 레이블 중 하나를 예측연속된 값을 예측예시학습 데이터를 A-B-C 그룹 중 하나로 매핑결과값이 어떤 값이든 나올 수 있음3.1.1 K-최근접 이웃왜 사용할까?→ 주어진 데이터에 대한 분류 언제 사용하면 좋을까?→ K-최근접 이웃은 직관전이며 사용하기 쉽기 때문에 초보자가 쓰기에 좋다. 또한, 훈련 데이터를 충분히 확보할 수 있는 환경에서 사용하면 좋다. K-최근접 이웃(K-nearst neighbor)은 새로운 입력을 받았을 때 기존 클러스터에서 모든 데이터와 인스턴스 기반 거리를 측정한 후 가장 많은 속성을 가진 클러스터에 할당하는 분류 알고리즘이다.과거 데..