knn算法例題經典：k近鄰算法的原理

投稿專員 • 2024-12-09 14:40 • 投稿

什麼是K-近鄰算法？

簡單的說，K-近鄰算法就是採用測量不同特徵值之間的距離方法來進行分類。它的工作原理是：存在一個樣本數據集合，也稱作訓練樣本集，並且樣本集中每個數據都存在標籤，即我們知道樣本集中每一數據與所屬分類的對應關係，輸入沒有標籤的新數據之後，將新數據的每個特徵與樣本集中數據對應的特徵進行比較，然後算法提取出樣本集中特徵最相似數據的分類標籤。一般來說，我們只選擇樣本數據集中前k個最相似的數據，這就是K-近鄰算法名稱的由來。

提問：親，你造K-近鄰算法是屬於監督學習還是無監督學習呢？

使用Python導入數據

從K-近鄰算法的工作原理中我們可以看出，要想實施這個算法來進行數據分類，我們手頭上得需要樣本數據，沒有樣本數據怎麼建立分類函數呢。所以，我們第一步就是導入樣本數據集合。

建立名為kNN.py的模塊，寫入代碼：

from numpy import *
import operator
def createDataSet():
group = array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])
labels = [‘A’,’A’,’B’,’B’]
return group, labels

代碼中，我們需要導入Python的兩個模塊：科學計算包NumPy和運算符模塊。NumPy函數庫是Python開發環境的一個獨立模塊，大多數Python版本里沒有默認安裝NumPy函數庫，因此這裡我們需要單獨安裝這個模塊。大家可以從sourceforge上下載安裝。

使用Python實現K-近鄰（KNN）算法

有很多的版本，這裡我選擇的是
numpy-1.7.0-win32-superpack-python2.7.exe。

實現K-近鄰算法

K-近鄰算法的具體思想如下：

（1）計算已知類別數據集中的點與當前點之間的距離

（2）按照距離遞增次序排序

（3）選取與當前點距離最小的k個點

（4）確定前k個點所在類別的出現頻率

（5）返回前k個點中出現頻率最高的類別作為當前點的預測分類

Python語言實現K-近鄰算法的代碼如下：

使用Python實現K-近鄰（KNN）算法

運算結果如下：

使用Python實現K-近鄰（KNN）算法

輸出結果是B：說明我們新的數據（[0,0]）是屬於B類。

代碼詳解

相信有很多朋友們對上面這個代碼有很多不理解的地方，接下來，我重點講解幾個此函數的關鍵點，以方便讀者們和我自己回顧一下這個算法代碼。

classify函數的參數：

inX：用於分類的輸入向量
dataSet：訓練樣本集合
labels：標籤向量
k：K-近鄰算法中的k

shape：是array的屬性，描述一個多維數組的維度。

tile（inX, (dataSetSize,1)）：把inX二維數組化，dataSetSize表示生成數組後的行數，1表示列的倍數。整個這一行代碼表示前一個二維數組矩陣的每一個元素減去後一個數組對應的元素值，這樣就實現了矩陣之間的減法，簡單方便得不讓你佩服不行！

axis=1：參數等於1的時候，表示矩陣中行之間的數的求和，等於0的時候表示列之間數的求和。

argsort()：對一個數組進行非降序排序

classCount.get(numOflabel,0) + 1：這一行代碼不得不說的確很精美啊。get()：該方法是訪問字典項的方法，即訪問下標鍵為numOflabel的項，如果沒有這一項，那麼初始值為0。然後把這一項的值加1。所以Python中實現這樣的操作就只需要一行代碼，實在是很簡潔高效。

後話

K-近鄰算法（KNN）原理以及代碼實現差不多就這樣了，接下來的任務就是更加熟悉它，爭取達到裸敲的地步。

原創文章，作者：投稿專員，如若轉載，請註明出處：https://www.506064.com/zh-hk/n/224811.html

贊 (0)

打賞

微信掃一掃

支付寶掃一掃

公認性能最好的筆記本：聯想電腦渠道價格

上一篇 2024-12-09 14:40

圖片掃描成pdf的方法：手機pdf掃描軟件

下一篇 2024-12-09 14:40

投稿
格蘭仕500L十字門風冷冰箱報價「家電冰箱價格」
500L大容積無霜冰箱，包郵價僅售1998元，擊破行業同品類冰箱最低價！國民家電格蘭仕近日重磅推出的命名為「合家歡」的超低價大冰箱，迅速成為「網紅「冰箱」。據悉，Galanz+ A…
投稿專員
2025-01-13
投稿
一文解說蘋果筆記本質量及報價「蘋果筆記本好不好」
有許多小夥伴在購入新的筆記本電腦之前，都會問有沒有必要買MacBook？幾年過去，這個問題依舊困擾着不少人，且如何選擇適合自己的MacBook也是一個難題，今天的內容希望能給小夥伴…
投稿專員
2025-01-13
投稿
性價比高的3款女低幫帆布鞋「帆布鞋女低幫」
有一種鞋，即使鞋櫃中已有了同款，還要各個顏色囤上一雙——沒錯，這種鞋就叫做帆布鞋！即使潮流如何更替，帆布鞋卻依舊能能牢牢佔據鞋櫃一角，超強的百搭型及實穿性更讓它成為明星或時尚達人們…
投稿專員
2025-01-13
投稿
鴻星爾克男裝衝鋒衣報價「鴻星爾克衝鋒衣男裝男裝」
在90後的青蔥歲月，比起昂貴的阿迪耐克，李寧、安踏、特步、361、鴻星爾克等國產運動品牌一直是中國普通人的首選。經過二十年的發展，李寧和安踏早已成為國貨潮牌的驕傲。曾經與安踏並駕…
投稿專員
2025-01-13
投稿
一款超好用的合金筷子使用體驗「合金筷子哪個牌子好」
中國人用筷子3000多年。小小一雙筷子，不僅承載着中國人的情感和記憶。它更是中國人，一日三餐必不可少的餐具。木製和竹製的筷子結實、輕便，所以成了很多家庭的首選，但這些筷子用一段時…
投稿專員
2025-01-13
投稿
適合個人白手起家的7個小項目「自由創業做些什麼」
窮人就不能逆襲了嗎？能，現在就是好多的創業者就是被窮給逼出來的，正所謂「窮則思變」。時代賦予了我們太多的責任，我們沒有趕上分配工作，沒有趕上分配房子，我們就不得已走上創業的道路，為…
投稿專員
2025-01-13
投稿
畢業生創業貸款申請條件材料和流程「應屆畢業生創業貸款怎麼申請」
大學生就業難，早已不是什麼新鮮的話題，在「大眾創業，萬眾創新」的大環境下，許多大學生開始走上了自主創業的道路。然後如果家裡沒有一定的底子的話，創業之路並不是那麼好走的，好在國家在這…
投稿專員
2025-01-13
投稿
阿里巴巴的業務模式及特點「阿里巴巴運營模式是什麼」
阿里巴巴的運營能力一直被業界稱道。從誕生之初，阿里巴巴就以促使雙方成交為目的，自然之中運營。最早創立的「雙十一」。商業模式應該有兩個概念：一個是大概念，即企業從事經營活動的所有方…
投稿專員
2025-01-13
投稿
一招教你搞定電腦數據備份「怎麼備份電腦系統數據」
我們工作時候，很多文件信息都是保存在電腦桌面的，大家都知道桌面文件都是放置於電腦系統盤C盤的。電腦出問題了，開不了機怎麼辦？許多人會選擇重裝系統。電腦重裝系統後，系統盤全部要清空，…
投稿專員
2025-01-13
投稿
揭秘李開復成功的真實原因「李開復創業故事」
我2009年創辦創新工場，從跨國公司高管變成本土創業者。雖然早年成名，但就創業而言也是新兵。往事回想起來，一地的心酸。比如：「VC+孵化」模式被質疑，飛遍全球才融到第一筆基金，剛…
投稿專員
2025-01-13

發表回復

登錄後才能評論