본문 바로가기
Data Analytics with python/[Theory]

[Machine Learning] K-means_1

by 보끔밥0130 2023. 2. 14.
728x90

 K-means 

● 군집화(Clustering)에서 가장 일반적으로 사용되는 알고리즘

 

군집 중심점이라는 특정한 임의의 지점을 선택해 해당 중심에 가장 가까운 포인트들을 선택하는 군집화 기법입니다.

 

< k-means 동작 원리 >

k=2인 군집화

 

① 2개의 군집 중심점을 임의로 설정(초기화 알고리즘에 의해 적합한 위치에 중심점이 위치함)합니다.

 

② 각 데이터는 가장 가까운 중심점에 소속합니다.

 

③ 중심점에 할당된 데이터들의 평균 중심으로 중심점을 이동시킵니다.

 

④ 각 데이터는 이동된 중심점을 기준으로 가장 가까운 중심점에 다시 소속합니다.

 

⑤ 다시 중심점에 할당된 데이터들의 평균 중심으로 중심점을 이동합니다.

 

⑥ 평균 중심 이동을 반복하여 중심점을 이동하였지만 데이터들의 중심점 소속 변경이 없으면 군집화가 완료됩니다.

 

 

728x90

댓글