k를 정해준다 (주로 홀수 → 짝수를 쓰면 1:1 상황이 나타날 수 있기 때문)
기존 데이터와 그 데이터의 속성들을 통해 새로운 데이터의 속성을 예측하는 알고리즘이다.
방법: 새로운 데이터를 기준으로 그래프상 거리가 가장 가까운 k개의 데이터를 찾는다.
k개 중 가장 많은 데이터가 속한 그룹(속성)을 새로운 데이터의 속성으로 예측한다.
나누는 기준: 더 많은 것을 걸러내는 것(더 적은 게 남음 = 더 깔끔함)이 일반적으로 선호됨 = Entropy를 낮추는 방향으로