K-최근접 이웃(KNN: K-Nearest Neighbors)

아가개발자/머신러닝 2020. 9. 18. 16:39

KNN (K-Nearest Neighbors)

: 주변 K개의 자료의 class로 분류하는 방식

x의 class를 점선 동그라미 범위 안의 K개의 class 분포를 보고 예측

파란 동그라미 3개, 초록 세모 2개 → x = 파란 동그라미 (투표 방식)

KNN은 게으른 학습(lazy learner), 사례중심 학습(instance-based learning)이라고 불림, 예측 모델을 만들고 파라미터를 추정하는 방식이 아니기 때문

: 가까운 이웃의 정보에 가중치를 부여

오른쪽 그래프의 x의 예측 class는 파란 동그라미, 왼쪽 그래프의 x의 예측 class는 초록 세모

K값이 바뀌면 예측한 class 값이 달라질 수 있음 → 가중 합 방식 사용

- 장점

- 단점

로지스틱 회귀-Logistic regression (0)	2020.09.28
다중선형회귀 - Multiple Linear Regression (0)	2020.09.28
KNN classification - iris (0)	2020.09.18
데이터 전처리와 최적화2 - 데이터 변환/데이터 정제/데이터 통합/데이터 불균형 (0)	2020.09.15
데이터 전처리와 최적화 - 데이터 실수화 (Data Vectorization) (0)	2020.09.15

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

인기포스트