主頁 > 知識(shí)庫 > pytorch 梯度NAN異常值的解決方案

pytorch 梯度NAN異常值的解決方案

熱門標(biāo)簽:聊城語音外呼系統(tǒng) 海外網(wǎng)吧地圖標(biāo)注注冊(cè) 騰訊地圖標(biāo)注沒法顯示 地圖標(biāo)注自己和別人標(biāo)注區(qū)別 南陽打電話機(jī)器人 ai電銷機(jī)器人的優(yōu)勢(shì) 打電話機(jī)器人營銷 商家地圖標(biāo)注海報(bào) 孝感營銷電話機(jī)器人效果怎么樣

pytorch 梯度NAN異常值

gradient 為nan可能原因:

1、梯度爆炸

2、學(xué)習(xí)率太大

3、數(shù)據(jù)本身有問題

4、backward時(shí),某些方法造成0在分母上, 如:使用方法sqrt()

定位造成nan的代碼:

import torch
# 異常檢測(cè)開啟
torch.autograd.set_detect_anomaly(True)
# 反向傳播時(shí)檢測(cè)是否有異常值,定位code
with torch.autograd.detect_anomaly():
 loss.backward()

pytorch處理inf和nan數(shù)值

在構(gòu)建網(wǎng)絡(luò)框架后,運(yùn)行代碼,發(fā)現(xiàn)很多tensor出現(xiàn)了inf值或者nan,在很多博客上沒有找到對(duì)應(yīng)的解決方法,大部分是基于numpy寫的,比較麻煩。

下面基于torch BIF函數(shù)實(shí)現(xiàn)替換這2個(gè)值。

a = torch.Tensor([[1, 2, np.nan], [np.inf, np.nan, 4], [3, 4, 5]])
 
a
Out[158]: 
tensor([[1., 2., nan],
        [inf, nan, 4.],
        [3., 4., 5.]])

下面把nan值還為0:

a = torch.where(torch.isnan(a), torch.full_like(a, 0), a)
 
a
Out[160]: 
tensor([[1., 2., 0.],
        [inf, 0., 4.],
        [3., 4., 5.]])

接著把inf替換為1:

a = torch.where(torch.isinf(a), torch.full_like(a, 0), a)
 
a
Out[162]: 
tensor([[1., 2., 0.],
        [0., 0., 4.],
        [3., 4., 5.]])

簡(jiǎn)單回顧

tips:對(duì)于某些tensor,可能已經(jīng)開啟了grad功能,需要把它先轉(zhuǎn)為普通tensor(使用.data)

torch.where(condition,T,F) 函數(shù)有三個(gè)輸入值,

第一個(gè)是判斷條件,

第二個(gè)是符合條件的設(shè)置值,

第三個(gè)是不符合條件的設(shè)置值

torch.full_like(input, fill_value, …) 返回與input相同size,單位值為fill_value的矩陣
 
#如下面這個(gè)例子,a為3*3的tensor
b =torch.full_like(a, 0,)
 
b
Out[165]: 
tensor([[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]])

以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

您可能感興趣的文章:
  • PyTorch梯度裁剪避免訓(xùn)練loss nan的操作
  • Pytorch訓(xùn)練過程出現(xiàn)nan的解決方式
  • pytorch 權(quán)重weight 與 梯度grad 可視化操作
  • PyTorch 如何檢查模型梯度是否可導(dǎo)
  • 淺談pytorch中為什么要用 zero_grad() 將梯度清零
  • PyTorch 如何自動(dòng)計(jì)算梯度

標(biāo)簽:六盤水 撫州 南寧 揚(yáng)州 聊城 楊凌 牡丹江 迪慶

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《pytorch 梯度NAN異常值的解決方案》,本文關(guān)鍵詞  pytorch,梯度,NAN,異常,值,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《pytorch 梯度NAN異常值的解決方案》相關(guān)的同類信息!
  • 本頁收集關(guān)于pytorch 梯度NAN異常值的解決方案的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章