비지도학습 3

[ML] 3. 머신 러닝 핵심 알고리즘: 비지도학습

3.2 비지도학습비지도 학습 : 레이블이 필요하지 않으며 정답이 없는 상태에서 훈련시키는 방식 비지도 학습에는 군집(clustering)과 차원 축소(dimensionality reduction)가 있다.군집은 각 데이터의 유사성(거리)을 측정한 후 유사성이 높은(거리가 짧은) 데이터끼리 집단으로 분류하는 것이다.차원 축소는 차원을 나타내는 특성을 줄여서 데이터를 줄이는 방식이다. 구분군집차원 축소목표데이터 그룹화데이터 간소화주요 알고리즘K-평균 군집화(K-Means)주성분 분석(PCA)예시사용자의 관심사에 따라 그룹화하여 마케팅에 활용데이터 압축중요한 속성 도출3.2.1 K-평균 군집화왜 사용할까?→ 주어진 데이터에 대한 군집화 언제 사용하면 좋을까?→ 주어진 데이터셋을 이용하여 몇 개의 클러스터를 ..

[ML] 06-2 k-평균

k-평균 알고리즘 소개 k-평균 알고리즘은 처음에 랜덤하게 클러스터 중심을 정하고 클러스터를 만든다. 그다음 클러스터의 중심을 이동하고 다시 클러스터를 만드는 식으로 반복해서 최적의 클러스터를 구성하는 알고리즘이다. 클러스터 중심은 k-평균 알고리즘이 만든 클러스터에 속한 샘플의 특성 평균값이다. 센트로이드라고 부르며 가장 가까운 클러스터 중심을 샘플의 또 다른 특성으로 사용하거나 새로운 샘플에 대한 예측으로 활용할 수 있다. 알고리즘의 작동 방식은 아래와 같다. 무작위로 k개의 클러스터 중심을 정한다. 각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터의 샘플로 지정한다. 클러스터에 속한 샘플의 평균값으로 클러스터 중심을 변경한다. 클러스터 중심에 변화가 없을 때까지 2번으로 돌아가 반복한다..

[ML] 06-1 군집 알고리즘

비지도 학습은 머신러닝의 한 종류로 훈련 데이터에 타깃이 없다. 타깃이 없기 때문에 외부의 도움 없이 스스로 유용한 무언가를 학습해야 한다. 대표적인 비지도 학습 작업으로 군집, 차원 축소 등이 있다. 과일 사진 데이터 준비 파일을 읽기 위해 코랩으로 다운로드한다. !wget https://bit.ly/fruits_300_data -O fruits_300_data.npy import numpy as np import matplotlib.pyplot as plt 넘파이에서 npy파일을 로드하기 위해 load()메서드에 파일 이름을 전달한다. fruits = np.load('fruits_300_data.npy') print(fruits.shape) 이 배열의 첫 번째 차원(300)은 샘플의 개수, 두 번째 ..