ptorch F.softmax() 梯度信息为None 和 pytorch 查找指定元素的索引
我在进行一个测试梯度实验的时候,发现,当原始变量流经F.softmax以后,原始变量的梯度就无法获得了,例子如下:
import torch.nn.functional as F import torch x = torch.randn(1,5,requires_grad=True) print(x) # x = F.softmax(x,dim=1) # print(x) l = 0 for i in range(5): l = l + x[0][i] print(l) l.backward() print(x.grad)复制代码
如果x不经过F.softmax(),则会出现如下的梯度信息:
tensor([[ 1.4093, -0.2620, 0.6668, -0.3897, 1.4681]], requires_grad=True) tensor(2.8925, grad_fn=<AddBackward0>) tensor([[1., 1., 1., 1., 1.]])复制代码
如果经过了F.softmax(),则x的梯度信息就无法获得了,例子如下:
import torch.nn.functional as F import torch x = torch.randn(1,5,requires_grad=True) print(x) x = F.softmax(x,dim=1) print(x) l = 0 for i in range(5): l = l + x[0][i] print(l) l.backward() print(x.grad)复制代码
此时的x的梯度为None:
tensor([[ 1.0408, 0.5212, 0.2902, -0.7637, -0.7276]], requires_grad=True) tensor([[0.4163, 0.2476, 0.1965, 0.0685, 0.0710]], grad_fn=<SoftmaxBackward>) tensor(1., grad_fn=<AddBackward0>) None复制代码
在pytorch中,我们经常需要查找tensor中某一个元素的索引,可能是在向量中查找索引,也可能是在矩阵中查找索引,下面分贝举例子:
1.在矩阵中查找某个指定元素的索引:
import torch import numpy as np a = torch.tensor( [[1,2,3],[4,5,6],[5,6,7],[6,7,8]] ) a_t2n = a.numpy() index = np.argwhere( a_t2n>4 ) print(index)复制代码
运行结果如下:
[[1 1] [1 2] [2 0] [2 1] [2 2] [3 0] [3 1] [3 2]]复制代码
返回的结果,比如第一个[1,1]代表a_t2n[1][1]=5,是满足条件的第一个元素的索引
2.在向量中查找某个指定元素的索引:
举例子如下:
import torch import numpy as np a = torch.tensor( [1,2,3,4,5,5,4,7] ) a_t2n = a.numpy() index = np.argwhere( a_t2n>4 ) print(index)复制代码
运行结果如下:
[[4] [5] [7]]复制代码
第一个结果[4],代表a_t2n[4]=5,是第一个满足这个条件的元素的索引。
作者:Tchunren
链接:https://juejin.cn/post/7032473008581115917