전체 글 122

[ML] 03-1 k-최근접 이웃 회귀

k-최근접 이웃 회귀 지도 학습 알고리즘은 분류와 회귀로 나뉜다. k-최근접 이웃 회귀는 k-최근접 이웃 분류와 동일하게 예측하려는 샘플에 가장 가까운 샘플 k개를 선택한다. 이 때 둘의 차이점은 회귀 알고리즘은 이웃한 샘플의 타깃이 어떠한 클래스가 아니라 임의의 수치라는 점이다. 데이터 준비 import numpy as np perch_length = np.array([8.4, 13.7, 15.0, 16.2, 17.4, 18.0, 18.7, 19.0, 19.6, 20.0, 21.0, 21.0, 21.0, 21.3, 22.0, 22.0, 22.0, 22.0, 22.0, 22.5, 22.5, 22.7, 23.0, 23.5, 24.0, 24.0, 24.6, 25.0, 25.6, 26.5, 27.3, 27...

[ML] 02-2 데이터 전처리

넘파이로 데이터 준비하기 1. 데이터 준비 bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0] bream_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, 500.0, 500.0, 340.0, 600.0, 600.0, 700.0, 700.0, 610.0,..

[ML] 02-1 훈련 세트와 테스트 세트

지도 학습과 비지도 학습 지도 학습 : 입력과 타깃을 전달하여 모델을 훈련한 다음 새로운 데이터를 예측하는 데 활용 비지도 학습 : 타깃 데이터 없이 입력 데이터에서 어떤 특징을 찾는 데 주로 활용 훈련 세트 : 모델을 훈련할 때 사용하는 데이터로 보통 훈련 세트가 클수록 좋기 때문에 테스트 데이터를 제외한 모든 데이터를 사용 테스트 세트 : 일반적으로 전체 데이터에서 20~30%를 테스트 세트로 사용 훈련 세트와 테스트 세트 생선의 길이와 무게를 위한 리스트를 생성한다. fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33..

[ML] 01-3 마켓과 머신러닝

생선 분류 문제 1. 도미 데이터 준비 bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0] bream_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, 500.0, 500.0, 340.0, 600.0, 600.0, 700.0, 700.0, 610.0, 6..

디지털 신호처리 | 신호의 종류

신호의 정의신호란?시간에 따라 변하는 전압, 전류, 또는 전자기파신호처리(1차원 처리) : 신호로부터 받은 데이터를 분석하기 위해서 어떠한 처리를 하는 것영상처리(2차원 처리) : 특정한 간격으로 잘라서 2차원으로 배열된 영상에 대해 특별한 처리를 통해 그 영상이 가지고 있는 컬러, 주파수 등의 정보들을 분석하는 것1차원 처리, 2차원 처리는 어떠한 객체가 생성하는 물리량을 획득해서 그 물리량이 보유하고 있는 특성이나 특징을 분석하는데 필요한 매우 중요한 기술이다.신호의 분류연속시간신호와 이산시간신호아날로그신호와 디지털 신호주기신호와 비주기 신호유한길이신호와 무한길이신호인과적 신호, 반인과적 신호, 비인과적 신호우함수신호와 기함수신호결정적 신호와 비결정적 신호연속시간신호와 이산시간신호란?연속시간신호(co..

신호시스템 2024.01.17

[백준] 10845 - 큐(python)

https://www.acmicpc.net/problem/10845 10845번: 큐 첫째 줄에 주어지는 명령의 수 N (1 ≤ N ≤ 10,000)이 주어진다. 둘째 줄부터 N개의 줄에는 명령이 하나씩 주어진다. 주어지는 정수는 1보다 크거나 같고, 100,000보다 작거나 같다. 문제에 나와있지 www.acmicpc.net 문제 정수를 저장하는 큐를 구현한 다음, 입력으로 주어지는 명령을 처리하는 프로그램을 작성하시오. 명령은 총 여섯 가지이다. push X: 정수 X를 큐에 넣는 연산이다. pop: 큐에서 가장 앞에 있는 정수를 빼고, 그 수를 출력한다. 만약 큐에 들어있는 정수가 없는 경우에는 -1을 출력한다. size: 큐에 들어있는 정수의 개수를 출력한다. empty: 큐가 비어있으면 1, 아..

알고리즘 2024.01.04

머신러닝 기본 용어와 기초 수학 개념

데이터의 구성 데이터는 피처(feature)와 라벨(label, 맞추고싶은 목표)로 구성됨 독립변수와 종속변수로도 불림 라벨은 y로 표기, 라벨의 유무로 지도학습, 비지도학습 구분 Feature(=attribute, 피처) 데이터 X의 특징, 혹은 항목을 의미 N : 데이터 샘플 갯수, D: 피처의 갯수 ex) 혈압, 몸무게, 나이 Parameter(=weight, 피라미터, 가중치) 주어진 데이터(입력값)말고, 모델이 가지고 있는 학습 가능한(learnable) 파라미터 ex) w0, w1, w2, ... , wD Hyperparameter(하이퍼 파라미터) 모델 학습에 있어, 인간이 정해야하는 변수들 학습률, 배치 크기 등등 Input(입력값) vs Output(출력값) ML 규칙 1. 평가 데이터를..

AI 2024.01.04

Regression vs Classification

회귀(Regression) 입력값: 연속값(실수형), 이산값(범주형) 등 모두 가능 출력값: 연속값(실수형) 모델 형태: 일반적인 함수 형태( eg. y = w1 x + w0) :머신러닝 모델이 함수 형태로 표현되는 것 분류(Classfication) 입력값: 연속값(실수형), 이산값(범주형)등 모두 출력값: 이산값(범주형) 모델 형태: 이진 분류라면 시그모이드(sigmoid)함수, 다중 분류일 경우 소프트맥스(softmax)함수 꼭 포함 위의 내용 비교를 통해 회귀모델은 연속값을 예측할 경우, 분류 모델은 이산값을 예측할 경우 활용할 수 있다.  혈압 몸무게 나이 지병 길동 130 34 14 X 철수 120 76 30 X ... ... ... ... ... 영희 150 50 51 O 위의 표의 데이터..

AI 2024.01.04

[백준] 2161 - 카드1(python)

https://www.acmicpc.net/problem/2161 2161번: 카드1 N장의 카드가 있다. 각각의 카드는 차례로 1부터 N까지의 번호가 붙어 있으며, 1번 카드가 제일 위에, N번 카드가 제일 아래인 상태로 순서대로 카드가 놓여 있다. 이제 다음과 같은 동작을 카드가 www.acmicpc.net 문제 N장의 카드가 있다. 각각의 카드는 차례로 1부터 N까지의 번호가 붙어 있으며, 1번 카드가 제일 위에, N번 카드가 제일 아래인 상태로 순서대로 카드가 놓여 있다. 이제 다음과 같은 동작을 카드가 한 장 남을 때까지 반복하게 된다. 우선, 제일 위에 있는 카드를 바닥에 버린다. 그 다음, 제일 위에 있는 카드를 제일 아래에 있는 카드 밑으로 옮긴다. 예를 들어 N=4인 경우를 생각해 보자...

알고리즘 2024.01.02

[백준] 1302 - 베스트셀러(python)

https://www.acmicpc.net/problem/1302 1302번: 베스트셀러 첫째 줄에 오늘 하루 동안 팔린 책의 개수 N이 주어진다. 이 값은 1,000보다 작거나 같은 자연수이다. 둘째부터 N개의 줄에 책의 제목이 입력으로 들어온다. 책의 제목의 길이는 50보다 작거나 같고 www.acmicpc.net 문제 김형택은 탑문고의 직원이다. 김형택은 계산대에서 계산을 하는 직원이다. 김형택은 그날 근무가 끝난 후에, 오늘 판매한 책의 제목을 보면서 가장 많이 팔린 책의 제목을 칠판에 써놓는 일도 같이 하고 있다. 오늘 하루 동안 팔린 책의 제목이 입력으로 들어왔을 때, 가장 많이 팔린 책의 제목을 출력하는 프로그램을 작성하시오. 입력 첫째 줄에 오늘 하루 동안 팔린 책의 개수 N이 주어진다. ..

알고리즘 2024.01.02