K-Means聚类算法,K-Means算法是一种传统的无监督学习聚类算法。其核心思想为,将数据集中的样本分成K个簇,簇与簇之间的相似度尽可能的高,而簇内的样本相似度尽量的低。它的基本流程如下,随机选取K个聚类中心,计算所有样本点到K个聚类中心的距离,将每个样本点归类到距离其最近的聚类中心所属的簇,更新聚类中心,即用每个簇里面各个样本点的平均值替换原来簇中心,重复步骤2至步骤4,直到聚类中心不再更新位置。K-Means算法的优势在于计算简单、计算时间短,聚类的结果可视化,但其缺点是需要提前给出K值,并且最终聚类结果与初始选择的聚类中心有关,对噪声和异常值敏感,对数据的密度分布有要求。