當前位置:股票大全官網 - 財經資訊 - 如何改進kmeans算法中k的選取

如何改進kmeans算法中k的選取

K-means聚類方法分為以下步驟:

首先,初始化集群中心

1.根據具體問題,根據經驗從樣本集中選擇C個合適的樣本作為初始聚類中心。

2.使用前c個樣本作為初始聚類中心。

3.將所有樣本隨機分為C類,計算每類的樣本均值,以樣本均值為初始聚類中心。

第二,初始聚類

1,根據接近原則,將樣本歸入各個聚類中心所代表的類中。

2.取壹個樣本,將其分類到最近的聚類中心的類別中,重新計算樣本均值並更新聚類中心。然後取壹個樣本,重復操作,直到所有的樣本都歸入相應的類別。

第三,判斷聚類是否合理。

用誤差平方和準則函數判斷聚類是否合理,如果不合理,則修改分類。循環進行判斷和修改,直到達到算法終止條件。