查准率和查全率公式的核心理解

一、查准率和查全率的定義

查准率和查全率是在信息檢索領域中廣泛使用的兩個指標。簡單來說,查准率是指檢索結果中相關的文檔數占檢索結果文檔數的比例,衡量了檢索結果的準確性;而查全率是指檢索結果中相關的文檔數占文檔庫中相關文檔數的比例,衡量了檢索的完整性。

// 查准率公式
precision = TP / (TP + FP)

// 查全率公式
recall = TP / (TP + FN)

二、混淆矩陣(Confusion Matrix)

混淆矩陣用於展示分類算法中True Positive(TP)、False Positive(FP)、False Negative(FN)、True Negative(TN)四種分類結果的數量。其中,TP表示正確的正例分類數量,FP表示錯誤的正例分類數量,FN表示錯誤的反例分類數量,TN表示正確的反例分類數量。

// 混淆矩陣展示
|---------------|--------------|
| 真實值/預測值 | 正例(1) | 反例(0) |
|---------------|--------------|
| 正例(1)     | TP         | FP        |
|---------------|-------------|
| 反例(0)     | FN         | TN        |
|---------------|-------------|

三、查准率和查全率的計算方法

1. 查准率的計算方法

查准率的計算方法為:TP / (TP + FP),即模型預測的正例中,真實正例的佔比。

在機器學習領域,通常使用Precision-Recall曲線來展示不同模型、不同超參組合下的查准率和查全率。通過調整模型及其超參數,使得Precision-Recall曲線上的點儘可能到達左上角,表示更高的查准率和查全率。

// Python代碼示例
from sklearn.metrics import precision_score

y_true = [1, 0, 1, 1, 0]
y_pred = [1, 1, 1, 0, 0]

precision = precision_score(y_true, y_pred)
print(precision) # 0.75

2. 查全率的計算方法

查全率的計算方法為:TP / (TP + FN),即所有真實正例被正確預測為正例的佔比。

// Python代碼示例
from sklearn.metrics import recall_score

y_true = [1, 0, 1, 1, 0]
y_pred = [1, 1, 1, 0, 0]

recall = recall_score(y_true, y_pred)
print(recall) # 0.6

四、F1得分

F1得分是查准率和查全率加權平均的一種綜合指標,其中F1得分=2 * Precision * Recall / (Precision + Recall)。

F1得分越高,說明模型的分類性能越好。

// Python代碼示例
from sklearn.metrics import f1_score

y_true = [1, 0, 1, 1, 0]
y_pred = [1, 1, 1, 0, 0]

f1 = f1_score(y_true, y_pred)
print(f1) # 0.6666666666666666

五、最佳閾值的確定

在Precision-Recall曲線中,還可以通過將不同的分類閾值應用於模型輸出的概率,來確定最優的閾值。

一般而言,隨着閾值的增加,查准率會逐漸變高,查全率會逐漸變低,因此需要在二者之間進行權衡,並選擇最佳的閾值。

// Python代碼示例
from sklearn.metrics import precision_recall_curve

y_true = [1, 0, 1, 1, 0]
y_prob = [0.7, 0.6, 0.8, 0.3, 0.4]

precision, recall, threshold = precision_recall_curve(y_true, y_prob)

六、小結

查准率和查全率是評估分類模型性能的重要指標之一,通過混淆矩陣來展示模型對正例和反例的分類結果,進而計算出查准率和查全率。

在一定條件下,使用F1得分和最佳閾值可以幫助我們發現最優模型即查准率和查全率都達到較高的水平。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/295536.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-27 12:56
下一篇 2024-12-27 12:56

相關推薦

  • 如何使用Upper公式

    Upper公式是一個在數學計算和科學領域中十分常用的公式,能夠把文本中的所有字母轉化為大寫字母。在本篇文章中,我們將詳細介紹如何使用Upper公式。 一、Upper公式的定義 Up…

    編程 2025-04-28
  • Think-ORM數據模型及數據庫核心操作

    本文主要介紹Think-ORM數據模型建立和數據庫核心操作。 一、模型定義 Think-ORM是一個開源的ORM框架,用於簡化在PHP應用中(特別是ThinkPHP)與關係數據庫之…

    編程 2025-04-27
  • Word編輯公式

    Word編輯公式是Microsoft Office軟件中一個非常實用的功能。本文將從多個方面對Word編輯公式進行詳細闡述,包括公式的插入、編輯、公式庫的使用以及常用的公式樣式 一…

    編程 2025-04-27
  • 用C語言表示階乘運算公式

    本文將從以下幾個方面對階乘運算公式用C語言表示進行詳細的闡述: 一、階乘運算公式簡介 階乘運算是指將正整數$n$連乘到1的運算,通常表示為$n!$,例如$5!=5\times4\t…

    編程 2025-04-25
  • 《Windows核心編程第7版》綜述

    一、Windows核心編程第7版pdf 《Windows核心編程第7版》是由Jeffrey Richter和Christophe Nasarre共同編寫的Windows編程書籍,出…

    編程 2025-04-25
  • 弘曆強弱王指標公式通達信版

    一、指標概述 弘曆強弱王指標是一種技術分析指標,其主要用於辨別股票的強弱,以及預測其未來的走勢。該指標包含4個短期指標和4個中長期指標,分別計算出強勢值和弱勢值,通過比較兩者的大小…

    編程 2025-04-25
  • 媒體查詢CSS:響應式設計的核心

    一、什麼是媒體查詢CSS? 媒體查詢是CSS3中引入的一種特性,它允許我們針對不同的設備和屏幕尺寸編寫不同的樣式規則。它可以判斷用戶使用的設備特性和瀏覽器窗口大小,並針對性地加載不…

    編程 2025-04-24
  • Word如何在公式右邊添加編號

    一、使用自動編號功能 在Word中,我們可以用自動編號功能來為公式添加編號。首先,選中公式,然後在頂部菜單欄中的“開始”選項卡中找到“自動編號”按鈕,進入下拉菜單,在其中選擇“附加…

    編程 2025-04-24
  • 詳解復化Simpson公式

    一、什麼是復化Simpson公式 在數值分析中, Simpson公式是一種數值積分方法。復化Simpson公式是將Simpson公式進行拓展,用於計算更為複雜的積分。復化Simps…

    編程 2025-04-23
  • Buck電路電感計算詳細公式

    在DC/DC變換器拓撲中,Buck電路常用於降低電壓。Buck電路可以很好地控制輸出電壓和電流,並且功率轉移能力高。在設計Buck電路時,電感是電路中最重要的元件之一,因為它影響着…

    編程 2025-04-23

發表回復

登錄後才能評論