PCA 2

[ML] 3. 머신 러닝 핵심 알고리즘: 비지도학습

3.2 비지도학습비지도 학습 : 레이블이 필요하지 않으며 정답이 없는 상태에서 훈련시키는 방식 비지도 학습에는 군집(clustering)과 차원 축소(dimensionality reduction)가 있다.군집은 각 데이터의 유사성(거리)을 측정한 후 유사성이 높은(거리가 짧은) 데이터끼리 집단으로 분류하는 것이다.차원 축소는 차원을 나타내는 특성을 줄여서 데이터를 줄이는 방식이다. 구분군집차원 축소목표데이터 그룹화데이터 간소화주요 알고리즘K-평균 군집화(K-Means)주성분 분석(PCA)예시사용자의 관심사에 따라 그룹화하여 마케팅에 활용데이터 압축중요한 속성 도출3.2.1 K-평균 군집화왜 사용할까?→ 주어진 데이터에 대한 군집화 언제 사용하면 좋을까?→ 주어진 데이터셋을 이용하여 몇 개의 클러스터를 ..

[ML] 06-3 주성분 분석

차원 축소는 원본 데이터의 특성을 적은 수의 새로운 특성으로 변환하는 비지도 학습의 한 종류이다. 차원 축소는 저장 공간을 줄이고 시각화하기 쉽고 다른 알고리즘의 성능을 높일 수 있다는 장점을 갖는다. 주성분 분석은 차원 축소 알고리즘의 하나로 데이터에서 가장 분산이 큰 방향을 찾는 방법이다. 이러한 방향을 주성분이라고 부르며 주성분 분석은 원본 데이터를 주성분에 투영하여 새로운 특성을 만들 수 있다. 일반적으로 주성분은 원본 데이터에 있는 특성 개수보다 작다. PCA 클래스 PCA 클래스를 통해 과일 사진 데이터에서 주성분 분석을 수행해보자. !wget https://bit.ly/fruits_300_data -O fruits_300.npy import numpy as np fruits = np.load..