用Python绘制混淆矩阵

一、Python绘制混淆矩阵

混淆矩阵是用来对分类器进行评价的一种矩阵,它展示了分类器在测试集上的预测效果。我们可以使用Python来画出混淆矩阵。

首先需要明确的是,混淆矩阵的行表示实际类别,列表示预测类别。例如,对于一个二分类问题,其中一个类别为阳性,另一个类别为阴性,如果将阳性预测为阴性,则是一个False Negative(FN);如果将阴性预测为阳性,则是一个False Positive(FP)。同理,如果将阳性预测为阳性,则是一个True Positive(TP);如果将阴性预测为阴性,则是一个True Negative(TN)。

|         |   Predicted No    |   Predicted Yes   |
|---------|-------------------|-------------------|
|    No   |        TN         |        FP         |
|   Yes   |        FN         |        TP         |

我们可以使用Python中的sklearn库来获取分类器的混淆矩阵。下面是一个代码示例:

from sklearn.metrics import confusion_matrix

y_true = [0, 1, 0, 1]
y_pred = [1, 1, 0, 0]

confusion_matrix(y_true, y_pred)

运行结果如下:

array([[1, 1],
       [1, 1]])

上方的结果表示,将0(No)预测为1(Yes)的次数为1,将1(Yes)预测为0(No)的次数为1,将0(No)预测为0(No)的次数为1,将1(Yes)预测为1(Yes)的次数为1。

二、混淆矩阵怎么画 Python

在了解了混淆矩阵的表示后,我们可以使用Python来画出混淆矩阵的可视化图。下方是一个代码示例:

import numpy as np
import itertools
import matplotlib.pyplot as plt
 
def plot_confusion_matrix(cm, classes,
                          normalize=False,
                          title='Confusion matrix',
                          cmap=plt.cm.Blues):
    """
    将混淆矩阵画出
    """
    if normalize:
        cm = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis]
        print("Normalized confusion matrix")
    else:
        print('Confusion matrix, without normalization')
 
    print(cm)
 
    # 画图
    plt.imshow(cm, interpolation='nearest', cmap=cmap)
    plt.title(title)
    plt.colorbar()
    tick_marks = np.arange(len(classes))
    plt.xticks(tick_marks, classes, rotation=45)
    plt.yticks(tick_marks, classes)
 
    # 循环遍历混淆矩阵并填上数字
    fmt = '.2f' if normalize else 'd'
    thresh = cm.max() / 2.
    for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])):
        plt.text(j, i, format(cm[i, j], fmt),
                 horizontalalignment="center",
                 color="white" if cm[i, j] > thresh else "black")
 
    plt.tight_layout()
    plt.ylabel('True label')
    plt.xlabel('Predicted label')
    plt.show()

# 测试数据
y_true = [0, 1, 0, 1]
y_pred = [1, 1, 0, 0]

# 获取混淆矩阵
cnf_matrix = confusion_matrix(y_true, y_pred)

# 绘制混淆矩阵
plot_confusion_matrix(cnf_matrix, classes=[0, 1])

运行结果如下:

上方的图表清晰地展示了混淆矩阵的各个元素以及数字标注。

三、Python混淆矩阵

要理解Python绘制混淆矩阵的原理,首先需要知道Python混淆矩阵的运作机制。混淆矩阵是指,将预测分类的结果与测试实际结果进行比较的矩阵。它是在机器学习数学领域中,用于衡量分类器(也称模型)质量的矩阵。

在Python中,我们可以使用许多不同的Python库来绘制混淆矩阵。常见的有matplotlib和seaborn等。这些库提供了一些内置的函数,用于绘制各种矩阵和图表。其中matplotlib.pyplot是Python中最常用的数据可视化库之一,因此下文将使用它来完善混淆矩阵的可视化图表。

四、Python混淆矩阵代码

下面是一个Python绘制混淆矩阵的代码示例:

import matplotlib.pyplot as plt
import numpy as np

def plot_confusion_matrix(cm, classes,
                          normalize=False,
                          title='Confusion matrix',
                          cmap=plt.cm.Blues):
    """
    绘制混淆矩阵
    """
    if normalize:
        cm = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis]
        print("Normalized confusion matrix")
    else:
        print('Confusion matrix, without normalization')

    print(cm)

    # 画图
    plt.imshow(cm, interpolation='nearest', cmap=cmap)
    plt.title(title)
    plt.colorbar()

    # 设定横纵坐标及标签
    tick_marks = np.arange(len(classes))
    plt.xticks(tick_marks, classes, rotation=45)
    plt.yticks(tick_marks, classes)

    # 标注数字
    fmt = '.2f' if normalize else 'd'
    thresh = cm.max() / 2.
    for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])):
        plt.text(j, i, format(cm[i, j], fmt),
                 horizontalalignment="center",
                 color="white" if cm[i, j] > thresh else "black")

    # 设置其他参数
    plt.tight_layout()
    plt.ylabel('True label')
    plt.xlabel('Predicted label')
    plt.show()

# 测试数据
y_true = [0, 1, 0, 1]
y_pred = [1, 1, 0, 0]

# 获取混淆矩阵
confusion_matrix = confusion_matrix(y_true, y_pred)

# 绘制混淆矩阵
class_names = ['0', '1'] # 类别名称
plot_confusion_matrix(confusion_matrix, classes=class_names)

五、Python生成混淆矩阵

要生成Python混淆矩阵,我们需要预测的结果和实际的结果。如果我们善用该矩阵的可视化表示形式,我们就可以清晰地了解分类器的表现,并根据我们的真实数据来更新算法。

下面是一个Python生成混淆矩阵的代码示例:

from sklearn.metrics import confusion_matrix
import seaborn as sns

# 获得测试数据
predictions = [0, 1, 1, 0, 1, 1]
true_classes = [1, 0, 1, 1, 1, 0]

# 获取混淆矩阵并利用热力图展示
cm = confusion_matrix(true_classes, predictions)
sns.heatmap(cm, annot=True, fmt='d', cmap='Reds')

六、Python画混淆矩阵

现在我们已经掌握了Python生成和绘制混淆矩阵的基本原理,下面这个代码示例演示了如何用Python画混淆矩阵:

from sklearn.metrics import confusion_matrix, classification_report
import seaborn as sns
import pandas as pd

# 定义画图函数
def plot_confusion_matrix(y_true, y_pred, cmap="Blues"):
    
    # 计算混淆矩阵数据
    cm = confusion_matrix(y_true, y_pred)
    cm_sum = np.sum(cm, axis=1, keepdims=True)
    cm_perc = cm / cm_sum.astype(float) * 100
    annot = np.empty_like(cm).astype(str)
    nrows, ncols = cm.shape
    for i in range(nrows):
        for j in range(ncols):
            c = cm[i, j]
            p = cm_perc[i, j]
            if i == j:
                s = cm_sum[i]
                annot[i, j] = '%.1f%%\n%d/%d' % (p, c, s)
            elif c == 0:
                annot[i, j] = ''
            else:
                annot[i, j] = '%.1f%%\n%d' % (p, c)
    cm = pd.DataFrame(cm, index=['True A', 'True B'], columns=['Pred A', 'Pred B'])
    cm.index.name = 'Actual'
    cm.columns.name = 'Predicted'
 
    # 设置画布
    fig, ax = plt.subplots(figsize=(2.5, 2.5))
    ax.text(-1.2, 1.2, 'Confusion\nMatrix', fontsize=12, transform=ax.transAxes)

    # 设置其它参数
    sns.heatmap(cm, annot=annot, fmt='', cmap=cmap, ax=ax)

    plt.show()

# 测试数据
actuals = ['A', 'B', 'B', 'A', 'A', 'B']
predicted = ['A', 'B', 'B', 'A', 'A', 'A']

# 画混淆矩阵
plot_confusion_matrix(actuals, predicted)

上方的混淆矩阵清晰且易于理解,对于评估分类结果具有重要意义。

原创文章,作者:小蓝,如若转载,请注明出处:https://www.506064.com/n/294109.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
小蓝小蓝
上一篇 2024-12-26 13:15
下一篇 2024-12-26 13:15

相关推荐

  • Python列表中负数的个数

    Python列表是一个有序的集合,可以存储多个不同类型的元素。而负数是指小于0的整数。在Python列表中,我们想要找到负数的个数,可以通过以下几个方面进行实现。 一、使用循环遍历…

    编程 2025-04-29
  • Python周杰伦代码用法介绍

    本文将从多个方面对Python周杰伦代码进行详细的阐述。 一、代码介绍 from urllib.request import urlopen from bs4 import Bea…

    编程 2025-04-29
  • 如何查看Anaconda中Python路径

    对Anaconda中Python路径即conda环境的查看进行详细的阐述。 一、使用命令行查看 1、在Windows系统中,可以使用命令提示符(cmd)或者Anaconda Pro…

    编程 2025-04-29
  • Python计算阳历日期对应周几

    本文介绍如何通过Python计算任意阳历日期对应周几。 一、获取日期 获取日期可以通过Python内置的模块datetime实现,示例代码如下: from datetime imp…

    编程 2025-04-29
  • Python中引入上一级目录中函数

    Python中经常需要调用其他文件夹中的模块或函数,其中一个常见的操作是引入上一级目录中的函数。在此,我们将从多个角度详细解释如何在Python中引入上一级目录的函数。 一、加入环…

    编程 2025-04-29
  • Python字典去重复工具

    使用Python语言编写字典去重复工具,可帮助用户快速去重复。 一、字典去重复工具的需求 在使用Python编写程序时,我们经常需要处理数据文件,其中包含了大量的重复数据。为了方便…

    编程 2025-04-29
  • python强行终止程序快捷键

    本文将从多个方面对python强行终止程序快捷键进行详细阐述,并提供相应代码示例。 一、Ctrl+C快捷键 Ctrl+C快捷键是在终端中经常用来强行终止运行的程序。当你在终端中运行…

    编程 2025-04-29
  • 蝴蝶优化算法Python版

    蝴蝶优化算法是一种基于仿生学的优化算法,模仿自然界中的蝴蝶进行搜索。它可以应用于多个领域的优化问题,包括数学优化、工程问题、机器学习等。本文将从多个方面对蝴蝶优化算法Python版…

    编程 2025-04-29
  • Python清华镜像下载

    Python清华镜像是一个高质量的Python开发资源镜像站,提供了Python及其相关的开发工具、框架和文档的下载服务。本文将从以下几个方面对Python清华镜像下载进行详细的阐…

    编程 2025-04-29
  • Python程序需要编译才能执行

    Python 被广泛应用于数据分析、人工智能、科学计算等领域,它的灵活性和简单易学的性质使得越来越多的人喜欢使用 Python 进行编程。然而,在 Python 中程序执行的方式不…

    编程 2025-04-29

发表回复

登录后才能评论