AI/혼자공부하는머신러닝딥러닝 17

[ML] 04-1 로지스틱 회귀

럭키백의 확률럭키백에 생선이 7개 들어있고, 럭키백에 들어간 생선의 크기, 무게 등이 주어졌을 때 7개의 생선에 대한 확률을 출력해아한다. 데이터 준비import pandas as pd fish = pd.read_csv('https://bit.ly/fish_csv_data') fish.head() 판다스의 unique()함수를 사용하여 Species 열에서의 고유한 값들을 출력할 수 있다.print(pd.unique(fish['Species'])) species를 제외한 나머지 5개의 열을 입력 데이터로 사용한다.fish_input = fish[['Weight','Length','Diagonal','Height','Width']].to_numpy() print(fish_input[:5]) species는..

[ML] 03-3 특성 공학과 규제

다중 회귀 다중 회귀(multiple regression) : 여러 개의 특성을 사용한 선형 회귀 특성 공학(feature engineering) : 기존 특성을 사용해 새로운 특성을 뽑아내는 작업 데이터 준비 판다스의 read_csv()함수에 주소를 넣은 후 to_numpy()메서드를 사용해 넘파이 배열로 변경한다. import pandas as pd df = pd.read_csv('https://bit.ly/perch_csv_data') perch_full = df.to_numpy() print(perch_full) 타깃 데이터는 이전과 동일한 방식으로 준비한다. import numpy as np perch_weight = np.array([5.9, 32.0, 40.0, 51.5, 70.0, 100..

[ML] 03-2 선형 회귀

k-최근접 이웃의 한계 k-최근접 이웃의 한계를 파악하기 위해 데이터와 모델을 준비한다. import numpy as np perch_length = np.array([8.4, 13.7, 15.0, 16.2, 17.4, 18.0, 18.7, 19.0, 19.6, 20.0, 21.0, 21.0, 21.0, 21.3, 22.0, 22.0, 22.0, 22.0, 22.0, 22.5, 22.5, 22.7, 23.0, 23.5, 24.0, 24.0, 24.6, 25.0, 25.6, 26.5, 27.3, 27.5, 27.5, 27.5, 28.0, 28.7, 30.0, 32.8, 34.5, 35.0, 36.5, 36.0, 37.0, 37.0, 39.0, 39.0, 39.0, 40.0, 40.0, 40.0, 40.0..

[ML] 03-1 k-최근접 이웃 회귀

k-최근접 이웃 회귀 지도 학습 알고리즘은 분류와 회귀로 나뉜다. k-최근접 이웃 회귀는 k-최근접 이웃 분류와 동일하게 예측하려는 샘플에 가장 가까운 샘플 k개를 선택한다. 이 때 둘의 차이점은 회귀 알고리즘은 이웃한 샘플의 타깃이 어떠한 클래스가 아니라 임의의 수치라는 점이다. 데이터 준비 import numpy as np perch_length = np.array([8.4, 13.7, 15.0, 16.2, 17.4, 18.0, 18.7, 19.0, 19.6, 20.0, 21.0, 21.0, 21.0, 21.3, 22.0, 22.0, 22.0, 22.0, 22.0, 22.5, 22.5, 22.7, 23.0, 23.5, 24.0, 24.0, 24.6, 25.0, 25.6, 26.5, 27.3, 27...

[ML] 02-2 데이터 전처리

넘파이로 데이터 준비하기 1. 데이터 준비 bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0] bream_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, 500.0, 500.0, 340.0, 600.0, 600.0, 700.0, 700.0, 610.0,..

[ML] 02-1 훈련 세트와 테스트 세트

지도 학습과 비지도 학습 지도 학습 : 입력과 타깃을 전달하여 모델을 훈련한 다음 새로운 데이터를 예측하는 데 활용 비지도 학습 : 타깃 데이터 없이 입력 데이터에서 어떤 특징을 찾는 데 주로 활용 훈련 세트 : 모델을 훈련할 때 사용하는 데이터로 보통 훈련 세트가 클수록 좋기 때문에 테스트 데이터를 제외한 모든 데이터를 사용 테스트 세트 : 일반적으로 전체 데이터에서 20~30%를 테스트 세트로 사용 훈련 세트와 테스트 세트 생선의 길이와 무게를 위한 리스트를 생성한다. fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33..

[ML] 01-3 마켓과 머신러닝

생선 분류 문제 1. 도미 데이터 준비 bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0] bream_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, 500.0, 500.0, 340.0, 600.0, 600.0, 700.0, 700.0, 610.0, 6..