[머신러닝]KNN(K-Nearest Neighbor) 최근접 이웃알고리즘으로 오렌지와 자몽 구별하기 사이킷런(scikit-learn)을 사용하여 KNN(K-Nearest Neighbor, 최근접 이웃 알고리즘)예제를 진행해보았다. 개발환경은 구글 colab에서 진행하였다. 오렌지와 자몽의 지름과 무게 데이터를 가지고, 훈련과 테스트 데이터를 나누어 학습하고, 이를 바탕으로 정답이 없는 예시를 넣었을때 이를 분류 가능하도록 해보자. 사이킷런(scikit-learn)이란? 사이킷런은 머신러닝 오픈소스 라이브러리이다. 기본적인 데이터 세트(붓꽃,보스턴집값, 당뇨병관련 등등)도 제공하고, 머신러닝 API(의사결정트리, 최근접이웃알고리즘, 회귀분석 등등)도 포함 되어 있다. 먼저 만들어져 있는 라이브러리를 활용하..