kNN(k-Nearest Neighbors) algorithm works 최근접 이웃 알고리즘

k를 정해준다 (주로 홀수 → 짝수를 쓰면 1:1 상황이 나타날 수 있기 때문)

기존 데이터와 그 데이터의 속성들을 통해 새로운 데이터의 속성을 예측하는 알고리즘이다.

방법: 새로운 데이터를 기준으로 그래프상 거리가 가장 가까운 k개의 데이터를 찾는다.

k개 중 가장 많은 데이터가 속한 그룹(속성)을 새로운 데이터의 속성으로 예측한다.

Decision Tree (의사결정트리)

  1. Define Problem
  2. Collect Training data
  3. Extract Data
  4. Build a tree
  5. Deploy machine
  6. Test with data

나누는 기준: 더 많은 것을 걸러내는 것(더 적은 게 남음 = 더 깔끔함)이 일반적으로 선호됨 = Entropy를 낮추는 방향으로