亚洲人成综合网站777香蕉 ,91精品国产综合久蜜臀,亚洲有码中文字幕

主頁(yè) > 知識(shí)庫(kù) > Pytorch訓(xùn)練模型得到輸出后計(jì)算F1-Score 和AUC的操作

Pytorch訓(xùn)練模型得到輸出后計(jì)算F1-Score 和AUC的操作

1、計(jì)算F1-Score

對(duì)于二分類來(lái)說(shuō)，假設(shè)batch size 大小為64的話，那么模型一個(gè)batch的輸出應(yīng)該是torch.size([64,2])，所以首先做的是得到這個(gè)二維矩陣的每一行的最大索引值，然后添加到一個(gè)列表中，同時(shí)把標(biāo)簽也添加到一個(gè)列表中，最后使用sklearn中計(jì)算F1的工具包進(jìn)行計(jì)算，代碼如下

import numpy as np
import sklearn.metrics import f1_score
prob_all = []
lable_all = []
for i, (data,label) in tqdm(train_data_loader):
    prob = model(data) #表示模型的預(yù)測(cè)輸出
    prob = prob.cpu().numpy() #先把prob轉(zhuǎn)到CPU上，然后再轉(zhuǎn)成numpy，如果本身在CPU上訓(xùn)練的話就不用先轉(zhuǎn)成CPU了
    prob_all.extend(np.argmax(prob,axis=1)) #求每一行的最大值索引
    label_all.extend(label)
print("F1-Score:{:.4f}".format(f1_score(label_all,prob_all)))

2、計(jì)算AUC

計(jì)算AUC的時(shí)候，本次使用的是sklearn中的roc_auc_score () 方法

輸入?yún)?shù)：

y_true：真實(shí)的標(biāo)簽。形狀 (n_samples，) 或 (n_samples, n_classes)。二分類的形狀 (n_samples，1)，而多標(biāo)簽情況的形狀 (n_samples, n_classes)。

y_score：目標(biāo)分?jǐn)?shù)。形狀 (n_samples，) 或 (n_samples, n_classes)。二分類情況形狀 (n_samples，1)，“分?jǐn)?shù)必須是具有較大標(biāo)簽的類的分?jǐn)?shù)”，通俗點(diǎn)理解：模型打分的第二列。舉個(gè)例子：模型輸入的得分是一個(gè)數(shù)組 [0.98361117 0.01638886]，索引是其類別，這里 “較大標(biāo)簽類的分?jǐn)?shù)”，指的是索引為 1 的分?jǐn)?shù)：0.01638886，也就是正例的預(yù)測(cè)得分。

average='macro'：二分類時(shí)，該參數(shù)可以忽略。用于多分類，' micro '：將標(biāo)簽指標(biāo)矩陣的每個(gè)元素看作一個(gè)標(biāo)簽，計(jì)算全局的指標(biāo)。' macro '：計(jì)算每個(gè)標(biāo)簽的指標(biāo)，并找到它們的未加權(quán)平均值。這并沒(méi)有考慮標(biāo)簽的不平衡。' weighted '：計(jì)算每個(gè)標(biāo)簽的指標(biāo)，并找到它們的平均值，根據(jù)支持度 (每個(gè)標(biāo)簽的真實(shí)實(shí)例的數(shù)量) 進(jìn)行加權(quán)。

sample_weight=None：樣本權(quán)重。形狀 (n_samples，)，默認(rèn) = 無(wú)。

max_fpr=None：

multi_class='raise'：(多分類的問(wèn)題在下一篇文章中解釋)

labels=None：

輸出：

auc：是一個(gè) float 的值。

import numpy as np
import sklearn.metrics import roc_auc_score
prob_all = []
lable_all = []
for i, (data,label) in tqdm(train_data_loader):
    prob = model(data) #表示模型的預(yù)測(cè)輸出
    prob_all.extend(prob[:,1].cpu().numpy()) #prob[:,1]返回每一行第二列的數(shù)，根據(jù)該函數(shù)的參數(shù)可知，y_score表示的較大標(biāo)簽類的分?jǐn)?shù)，因此就是最大索引對(duì)應(yīng)的那個(gè)值，而不是最大索引值
    label_all.extend(label)
print("AUC:{:.4f}".format(roc_auc_score(label_all,prob_all)))

補(bǔ)充：pytorch訓(xùn)練模型的一些坑

1. 圖像讀取

opencv的python和c++讀取的圖像結(jié)果不一致，是因?yàn)閜ython和c++采用的opencv版本不一樣，從而使用的解碼庫(kù)不同，導(dǎo)致讀取的結(jié)果不同。

2. 圖像變換

PIL和pytorch的圖像resize操作，與opencv的resize結(jié)果不一樣，這樣會(huì)導(dǎo)致訓(xùn)練采用PIL，預(yù)測(cè)時(shí)采用opencv，結(jié)果差別很大，尤其是在檢測(cè)和分割任務(wù)中比較明顯。

3. 數(shù)值計(jì)算

pytorch的torch.exp與c++的exp計(jì)算，10e-6的數(shù)值時(shí)候會(huì)有10e-3的誤差，對(duì)于高精度計(jì)算需要特別注意，比如

兩個(gè)輸入5.601597， 5.601601，經(jīng)過(guò)exp計(jì)算后變成270.85862343143174， 270.85970686809225

以上為個(gè)人經(jīng)驗(yàn)，希望能給大家一個(gè)參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

解決Pytorch半精度浮點(diǎn)型網(wǎng)絡(luò)訓(xùn)練的問(wèn)題
PyTorch梯度裁剪避免訓(xùn)練loss nan的操作
pytorch訓(xùn)練神經(jīng)網(wǎng)絡(luò)爆內(nèi)存的解決方案
pytorch加載預(yù)訓(xùn)練模型與自己模型不匹配的解決方案
Pytorch訓(xùn)練網(wǎng)絡(luò)過(guò)程中l(wèi)oss突然變?yōu)?的解決方案
pytorch 如何使用float64訓(xùn)練

標(biāo)簽：常德惠州黑龍江四川上海黔西鷹潭益陽(yáng)

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《Pytorch訓(xùn)練模型得到輸出后計(jì)算F1-Score 和AUC的操作》，本文關(guān)鍵詞 Pytorch,訓(xùn)練,模型,得到,輸出,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題，煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無(wú)關(guān)。