K-means 클러스터링(K-means clustering)

1 분 소요

우리가 흔히 알고 있는 기계학습(Machine Learing)은 신경망에서부터 시작되었다.

기계학습(Machine learning)

기계학습을 다이어그램으로 나타내자면 인공지능에 포함되며 이 기계학습은 딥러닝을 포함하고 있다.

기계학습(Machine learning) 의 분류

기계학습은 크게 지도학습(Supervised learning) , 자율학습(Unsupervised learning), 강화학습(Reinforment learning)으로 분류된다.

지도학습(Supervised learning) : (레이블이) 정해진 데이터를 가지고 학습을 진행하며 이를 Training Set 이라고도 부른다. 주어진 예제와 정답(레이블)을 제공받으며 입력을 출력에 매핑한다. 비지도학습(Unsupervised learning / 자율학습) : un-labeled data(레이블이 달려있지 않은 데이터) 와 정답이 주어지지 않지만 입력을 스스로 분류한다. 강화학습(Reinforment learning) : 처음에 학습 데이터가 주어지지 않으며 보상이나 처벌 형태로 피드백이 주어지면 피드백에 의하여 학습 데이터가 주어진다. 우리가 잘 알고 있는 알파고 같은 경우도 강화학습을 통해 학습시켰다고 알고 있다.

K-means 클러스터링

여기서 내가 설명할 K-means 같은 경우는 비지도학습(자율학습) 중 대표적인 학습이 클러스터링(군집화,clustering) 이며 이 클러스터링은 데이터간 거리를 계산하여 몇 개의 군집을 나누는 방법을 의미한다. 또한 K-means 클러스터링이 가장 고전적인 클러스터링 방법이다.

K-means 클러스터링은 입력데이터가 주어지면 k 개의 클러스터로 묶는 것을 의미한다.