一、Python繪製混淆矩陣
混淆矩陣是用來對分類器進行評價的一種矩陣,它展示了分類器在測試集上的預測效果。我們可以使用Python來畫出混淆矩陣。
首先需要明確的是,混淆矩陣的行表示實際類別,列表示預測類別。例如,對於一個二分類問題,其中一個類別為陽性,另一個類別為陰性,如果將陽性預測為陰性,則是一個False Negative(FN);如果將陰性預測為陽性,則是一個False Positive(FP)。同理,如果將陽性預測為陽性,則是一個True Positive(TP);如果將陰性預測為陰性,則是一個True Negative(TN)。
| | Predicted No | Predicted Yes | |---------|-------------------|-------------------| | No | TN | FP | | Yes | FN | TP |
我們可以使用Python中的sklearn庫來獲取分類器的混淆矩陣。下面是一個代碼示例:
from sklearn.metrics import confusion_matrix y_true = [0, 1, 0, 1] y_pred = [1, 1, 0, 0] confusion_matrix(y_true, y_pred)
運行結果如下:
array([[1, 1], [1, 1]])
上方的結果表示,將0(No)預測為1(Yes)的次數為1,將1(Yes)預測為0(No)的次數為1,將0(No)預測為0(No)的次數為1,將1(Yes)預測為1(Yes)的次數為1。
二、混淆矩陣怎麼畫 Python
在了解了混淆矩陣的表示後,我們可以使用Python來畫出混淆矩陣的可視化圖。下方是一個代碼示例:
import numpy as np import itertools import matplotlib.pyplot as plt def plot_confusion_matrix(cm, classes, normalize=False, title='Confusion matrix', cmap=plt.cm.Blues): """ 將混淆矩陣畫出 """ if normalize: cm = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis] print("Normalized confusion matrix") else: print('Confusion matrix, without normalization') print(cm) # 畫圖 plt.imshow(cm, interpolation='nearest', cmap=cmap) plt.title(title) plt.colorbar() tick_marks = np.arange(len(classes)) plt.xticks(tick_marks, classes, rotation=45) plt.yticks(tick_marks, classes) # 循環遍歷混淆矩陣並填上數字 fmt = '.2f' if normalize else 'd' thresh = cm.max() / 2. for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])): plt.text(j, i, format(cm[i, j], fmt), horizontalalignment="center", color="white" if cm[i, j] > thresh else "black") plt.tight_layout() plt.ylabel('True label') plt.xlabel('Predicted label') plt.show() # 測試數據 y_true = [0, 1, 0, 1] y_pred = [1, 1, 0, 0] # 獲取混淆矩陣 cnf_matrix = confusion_matrix(y_true, y_pred) # 繪製混淆矩陣 plot_confusion_matrix(cnf_matrix, classes=[0, 1])
運行結果如下:
上方的圖表清晰地展示了混淆矩陣的各個元素以及數字標註。
三、Python混淆矩陣
要理解Python繪製混淆矩陣的原理,首先需要知道Python混淆矩陣的運作機制。混淆矩陣是指,將預測分類的結果與測試實際結果進行比較的矩陣。它是在機器學習數學領域中,用于衡量分類器(也稱模型)質量的矩陣。
在Python中,我們可以使用許多不同的Python庫來繪製混淆矩陣。常見的有matplotlib和seaborn等。這些庫提供了一些內置的函數,用於繪製各種矩陣和圖表。其中matplotlib.pyplot是Python中最常用的數據可視化庫之一,因此下文將使用它來完善混淆矩陣的可視化圖表。
四、Python混淆矩陣代碼
下面是一個Python繪製混淆矩陣的代碼示例:
import matplotlib.pyplot as plt import numpy as np def plot_confusion_matrix(cm, classes, normalize=False, title='Confusion matrix', cmap=plt.cm.Blues): """ 繪製混淆矩陣 """ if normalize: cm = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis] print("Normalized confusion matrix") else: print('Confusion matrix, without normalization') print(cm) # 畫圖 plt.imshow(cm, interpolation='nearest', cmap=cmap) plt.title(title) plt.colorbar() # 設定橫縱坐標及標籤 tick_marks = np.arange(len(classes)) plt.xticks(tick_marks, classes, rotation=45) plt.yticks(tick_marks, classes) # 標註數字 fmt = '.2f' if normalize else 'd' thresh = cm.max() / 2. for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])): plt.text(j, i, format(cm[i, j], fmt), horizontalalignment="center", color="white" if cm[i, j] > thresh else "black") # 設置其他參數 plt.tight_layout() plt.ylabel('True label') plt.xlabel('Predicted label') plt.show() # 測試數據 y_true = [0, 1, 0, 1] y_pred = [1, 1, 0, 0] # 獲取混淆矩陣 confusion_matrix = confusion_matrix(y_true, y_pred) # 繪製混淆矩陣 class_names = ['0', '1'] # 類別名稱 plot_confusion_matrix(confusion_matrix, classes=class_names)
五、Python生成混淆矩陣
要生成Python混淆矩陣,我們需要預測的結果和實際的結果。如果我們善用該矩陣的可視化表示形式,我們就可以清晰地了解分類器的表現,並根據我們的真實數據來更新演算法。
下面是一個Python生成混淆矩陣的代碼示例:
from sklearn.metrics import confusion_matrix import seaborn as sns # 獲得測試數據 predictions = [0, 1, 1, 0, 1, 1] true_classes = [1, 0, 1, 1, 1, 0] # 獲取混淆矩陣並利用熱力圖展示 cm = confusion_matrix(true_classes, predictions) sns.heatmap(cm, annot=True, fmt='d', cmap='Reds')
六、Python畫混淆矩陣
現在我們已經掌握了Python生成和繪製混淆矩陣的基本原理,下面這個代碼示例演示了如何用Python畫混淆矩陣:
from sklearn.metrics import confusion_matrix, classification_report import seaborn as sns import pandas as pd # 定義畫圖函數 def plot_confusion_matrix(y_true, y_pred, cmap="Blues"): # 計算混淆矩陣數據 cm = confusion_matrix(y_true, y_pred) cm_sum = np.sum(cm, axis=1, keepdims=True) cm_perc = cm / cm_sum.astype(float) * 100 annot = np.empty_like(cm).astype(str) nrows, ncols = cm.shape for i in range(nrows): for j in range(ncols): c = cm[i, j] p = cm_perc[i, j] if i == j: s = cm_sum[i] annot[i, j] = '%.1f%%\n%d/%d' % (p, c, s) elif c == 0: annot[i, j] = '' else: annot[i, j] = '%.1f%%\n%d' % (p, c) cm = pd.DataFrame(cm, index=['True A', 'True B'], columns=['Pred A', 'Pred B']) cm.index.name = 'Actual' cm.columns.name = 'Predicted' # 設置畫布 fig, ax = plt.subplots(figsize=(2.5, 2.5)) ax.text(-1.2, 1.2, 'Confusion\nMatrix', fontsize=12, transform=ax.transAxes) # 設置其它參數 sns.heatmap(cm, annot=annot, fmt='', cmap=cmap, ax=ax) plt.show() # 測試數據 actuals = ['A', 'B', 'B', 'A', 'A', 'B'] predicted = ['A', 'B', 'B', 'A', 'A', 'A'] # 畫混淆矩陣 plot_confusion_matrix(actuals, predicted)
上方的混淆矩陣清晰且易於理解,對於評估分類結果具有重要意義。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/294109.html