728x90
K-means
● 군집화(Clustering)에서 가장 일반적으로 사용되는 알고리즘
● 군집 중심점이라는 특정한 임의의 지점을 선택해 해당 중심에 가장 가까운 포인트들을 선택하는 군집화 기법입니다.
< k-means 동작 원리 >
k=2인 군집화
① 2개의 군집 중심점을 임의로 설정(초기화 알고리즘에 의해 적합한 위치에 중심점이 위치함)합니다.
② 각 데이터는 가장 가까운 중심점에 소속합니다.
③ 중심점에 할당된 데이터들의 평균 중심으로 중심점을 이동시킵니다.
④ 각 데이터는 이동된 중심점을 기준으로 가장 가까운 중심점에 다시 소속합니다.
⑤ 다시 중심점에 할당된 데이터들의 평균 중심으로 중심점을 이동합니다.
⑥ 평균 중심 이동을 반복하여 중심점을 이동하였지만 데이터들의 중심점 소속 변경이 없으면 군집화가 완료됩니다.
728x90
'Data Analytics with python > [Theory]' 카테고리의 다른 글
[Machine Learning] K-Menas_2 (0) | 2023.02.14 |
---|---|
[Machine Learning] 실루엣 분석 (0) | 2023.02.14 |
[Machine Learning] 차원 축소 (0) | 2023.02.13 |
[Machine Learning] LDA (0) | 2023.02.13 |
[Machine Learning][Regression] 회귀 소개 (0) | 2023.02.02 |
댓글