聚類和分類的區別「7種常用的聚類方法有哪些」

投稿專員 • 2024-12-15 12:27 • 投稿

典型聚類算法

基於劃分的方法

代表：kmeans算法

集成聚類系列（二）：常用的聚類算法及聚類算法評價指標

基於層次的方法

代表：CURE算法

集成聚類系列（二）：常用的聚類算法及聚類算法評價指標

基於網格的方法

代表：STING算法

將數據集合X劃分多層網格結構，從某一層開始計算查詢該層網格間的屬性值，計算屬性值與閾值的關係，判定網格間的相關情況，不相關的網格不作考慮如果網格相關，則進入下一層的相關區域繼續第二步，直到下一層為最底層返回相關網格結果

基於密度的方法

代表：DBSCAN算法

輸入數據集合X，隨機選取一點，並找出這個點的所有高密度可達點遍歷此點的所有 ε 鄰域內的點，並尋找這些密度可達點，判定某點 ε− 鄰域內的點，並尋找這些點密度可達點，判定某點的 ε− 鄰域內的點數是否超過閾值點數，超過則構成核心點掃描數據集，尋找沒有被聚類的數據點，重複第二步輸出劃分的類，並輸出異常值點（不和其他密度相連）

神經網絡的方法

代表：SOM算法

集成聚類系列（二）：常用的聚類算法及聚類算法評價指標

基於圖的聚類方法

代表：譜聚類算法

集成聚類系列（二）：常用的聚類算法及聚類算法評價指標

聚類算法的評價指標

一個好的聚類方法可以產生高品質簇，是的簇內相似度高，簇間相似度低。一般來說，評估聚類質量有兩個標準，內部質量評價指標和外部評價指標。

內部質量評價標準

內部評價指標是利用數據集的屬性特徵來評價聚類算法的優劣。通過計算總體的相似度，簇間平均相似度或簇內平均相似度來評價聚類質量。評價聚類效果的高低通常使用聚類的有效性指標，所以目前的檢驗聚類的有效性指標主要是通過簇間距離和簇內距離來衡量。這類指標常用的有CH（Calinski-Harabasz）指標等

CH指標

CH指標定義為：

集成聚類系列（二）：常用的聚類算法及聚類算法評價指標

集成聚類系列（二）：常用的聚類算法及聚類算法評價指標

簇的凝聚度

簇內點對的平均距離反映了簇的凝聚度，一般使用組內誤差平方（SSE）表示：

集成聚類系列（二）：常用的聚類算法及聚類算法評價指標

簇的鄰近度

簇的鄰近度用組間平方和（SSB）表示，即簇的質心 C_i 到簇內所有數據點的總平均值 c 的距離的平方和

外部質量評價標準

外部質量評價指標是基於已知分類標籤數據集進行評價的，這樣可以將原有標籤數據與聚類輸出結果進行對比。外部質量評價指標的理想聚類結果是：具有不同類標籤的數據聚合到不同的簇中，具有相同類標籤的數據聚合相同的簇中。外部質量評價準則通常使用熵，純度等指標進行度量。

熵：

簇內包含單個類對象的一種度量。對於每一個簇，首先計算數據的類分布，即對於簇 i ，計算簇 i 的成員屬於類 j 的概率

集成聚類系列（二）：常用的聚類算法及聚類算法評價指標

其中m_i表示簇 i 中所有對象的個數，而 m_ij 是簇 i中類 j 的對象個數。使用類分布，用標準公式：

集成聚類系列（二）：常用的聚類算法及聚類算法評價指標

計算每個簇 i 的熵，其中K是類個數。簇集合的總熵用每個簇的熵的加權和計算即：

集成聚類系列（二）：常用的聚類算法及聚類算法評價指標

其中K是簇的個數，而 m 是簇內數據點的總和

純度：

簇內包含單個類對象的另外一種度量。簇 i 的純度為

集成聚類系列（二）：常用的聚類算法及聚類算法評價指標

，而聚類總純度為：

集成聚類系列（二）：常用的聚類算法及聚類算法評價指標

原創文章，作者：投稿專員，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/255499.html

贊 (0)

打賞

微信掃一掃

支付寶掃一掃

電腦的電池的位置「筆記本電腦電池充電方法」

上一篇 2024-12-15 12:27

藍沛，重新定義了電子煙

下一篇 2024-12-15 12:27

投稿
格蘭仕500L十字門風冷冰箱報價「家電冰箱價格」
500L大容積無霜冰箱，包郵價僅售1998元，擊破行業同品類冰箱最低價！國民家電格蘭仕近日重磅推出的命名為“合家歡”的超低價大冰箱，迅速成為“網紅“冰箱”。據悉，Galanz+ A…
投稿專員
2025-01-13
投稿
一文解說蘋果筆記本質量及報價「蘋果筆記本好不好」
有許多小夥伴在購入新的筆記本電腦之前，都會問有沒有必要買MacBook？幾年過去，這個問題依舊困擾着不少人，且如何選擇適合自己的MacBook也是一個難題，今天的內容希望能給小夥伴…
投稿專員
2025-01-13
投稿
一款超好用的合金筷子使用體驗「合金筷子哪個牌子好」
中國人用筷子3000多年。小小一雙筷子，不僅承載着中國人的情感和記憶。它更是中國人，一日三餐必不可少的餐具。木製和竹製的筷子結實、輕便，所以成了很多家庭的首選，但這些筷子用一段時…
投稿專員
2025-01-13
投稿
鴻星爾克男裝衝鋒衣報價「鴻星爾克衝鋒衣男裝男裝」
在90後的青蔥歲月，比起昂貴的阿迪耐克，李寧、安踏、特步、361、鴻星爾克等國產運動品牌一直是中國普通人的首選。經過二十年的發展，李寧和安踏早已成為國貨潮牌的驕傲。曾經與安踏並駕…
投稿專員
2025-01-13
投稿
性價比高的3款女低幫帆布鞋「帆布鞋女低幫」
有一種鞋，即使鞋櫃中已有了同款，還要各個顏色囤上一雙——沒錯，這種鞋就叫做帆布鞋！即使潮流如何更替，帆布鞋卻依舊能能牢牢佔據鞋櫃一角，超強的百搭型及實穿性更讓它成為明星或時尚達人們…
投稿專員
2025-01-13
投稿
畢業生創業貸款申請條件材料和流程「應屆畢業生創業貸款怎麼申請」
大學生就業難，早已不是什麼新鮮的話題，在“大眾創業，萬眾創新”的大環境下，許多大學生開始走上了自主創業的道路。然後如果家裡沒有一定的底子的話，創業之路並不是那麼好走的，好在國家在這…
投稿專員
2025-01-13
投稿
阿里巴巴的業務模式及特點「阿里巴巴運營模式是什麼」
阿里巴巴的運營能力一直被業界稱道。從誕生之初，阿里巴巴就以促使雙方成交為目的，自然之中運營。最早創立的“雙十一”。商業模式應該有兩個概念：一個是大概念，即企業從事經營活動的所有方…
投稿專員
2025-01-13
投稿
適合個人白手起家的7個小項目「自由創業做些什麼」
窮人就不能逆襲了嗎？能，現在就是好多的創業者就是被窮給逼出來的，正所謂“窮則思變”。時代賦予了我們太多的責任，我們沒有趕上分配工作，沒有趕上分配房子，我們就不得已走上創業的道路，為…
投稿專員
2025-01-13
投稿
揭曉u盤和移動硬盤優缺點及報價「u盤和移動硬盤區別」
無論是辦公，還是學習，都經常用到移動存儲，把東西複製來粘貼去的，這時候，你一般用的是U盤？還是說移動硬盤呢？還是說，你目前需要買，但正在糾結買哪一個，卻又不知道如何挑選呢？如果你處…
投稿專員
2025-01-13
投稿
揭秘李開復成功的真實原因「李開復創業故事」
我2009年創辦創新工場，從跨國公司高管變成本土創業者。雖然早年成名，但就創業而言也是新兵。往事回想起來，一地的心酸。比如：“VC+孵化”模式被質疑，飛遍全球才融到第一筆基金，剛…
投稿專員
2025-01-13

發表回復

登錄後才能評論