Python實現混淆矩陣熱力圖

混淆矩陣是分類模型預測結果的可視化工具，通過混淆矩陣可以更好的評估預測模型的性能。混淆矩陣通常用于衡量二分類模型的預測效果，但是也可以擴展到多分類問題。

在本篇文章中，我們會介紹如何使用Python來實現混淆矩陣的可視化工具——熱力圖。首先，我們會介紹熱力圖的基本知識和使用場景，然後詳細講解如何使用Python繪製混淆矩陣熱力圖。

一、熱力圖的基本知識和使用場景

熱力圖是一種用不同顏色來表示數值大小的二維圖表。在混淆矩陣中，我們可以使用熱力圖來表示模型分類的預測結果，其中每個方格的顏色代表該分類模型在對應真實標籤與預測結果下的數量。

熱力圖可以讓我們更加直觀地觀察混淆矩陣中每種預測情況的比例，同時也可以發現模型預測結果的不足之處，進而對模型進行調整和改進。

二、如何使用Python繪製混淆矩陣熱力圖

1. 混淆矩陣數據的準備

首先，我們需要從分類模型中獲取混淆矩陣的各種類別的預測結果和真實標籤，然後將其整理成一個二維矩陣。

假設我們的混淆矩陣如下：

[[32, 21, 8],
 [12, 44, 6],
 [2, 3, 32]]

每一行代表真實標籤，每一列代表模型的預測結果，在這個矩陣中，行列數都為3。

2. 熱力圖的繪製

接下來，我們將使用Python庫matplotlib和seaborn來繪製混淆矩陣熱力圖。

首先，我們需要導入需要使用的Python庫。

import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np

然後，我們可以使用seaborn的heatmap函數來繪製熱力圖。

def plot_confusion_matrix(cm, classes,
                          normalize=False,
                          title='Confusion matrix',
                          cmap=plt.cm.Blues):
    
    plt.figure(figsize=(8, 6))
    plt.imshow(cm, interpolation='nearest', cmap=cmap)
    plt.title(title)
    plt.colorbar()
    tick_marks = np.arange(len(classes))
    plt.xticks(tick_marks, classes, rotation=45)
    plt.yticks(tick_marks, classes)

    fmt = '.2f' if normalize else 'd'
    thresh = cm.max() / 2.
    for i in range(cm.shape[0]):
        for j in range(cm.shape[1]):
            plt.text(j, i, format(cm[i, j], fmt),
                     ha="center", va="center",
                     color="white" if cm[i, j] > thresh else "black")

    plt.tight_layout()
    plt.ylabel('True label')
    plt.xlabel('Predicted label')
    plt.show()

上述代碼中，cm為混淆矩陣數據，classes為分類模型的標籤類別，normalize為是否進行標準化，title為熱力圖標題，cmap為熱力圖的顏色映射。

我們可以通過使用如下代碼來生成熱力圖：

plot_confusion_matrix(cm, classes=['1', '2', '3'])

最終的熱力圖如下所示：

三、總結

本篇文章我們介紹了混淆矩陣在分類模型中的重要性和使用場景，並詳細介紹了使用Python來繪製混淆矩陣熱力圖的方法。通過熱力圖，我們可以更加直觀地觀察分類模型的分類情況，並進一步優化和改進模型。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-hk/n/230672.html