11-20 07:51 阅读 216

ptorch F.softmax() 梯度信息为None 和 pytorch 查找指定元素的索引

我在进行一个测试梯度实验的时候，发现，当原始变量流经F.softmax以后，原始变量的梯度就无法获得了，例子如下：

import torch.nn.functional as F
import torch


x = torch.randn(1,5,requires_grad=True)
print(x)
# x = F.softmax(x,dim=1)
# print(x)
l = 0
for i in range(5):
    l = l + x[0][i]

print(l)
l.backward()
print(x.grad)复制代码

如果x不经过F.softmax()，则会出现如下的梯度信息：

tensor([[ 1.4093, -0.2620,  0.6668, -0.3897,  1.4681]], requires_grad=True)
tensor(2.8925, grad_fn=<AddBackward0>)
tensor([[1., 1., 1., 1., 1.]])复制代码

如果经过了F.softmax(),则x的梯度信息就无法获得了，例子如下：

import torch.nn.functional as F
import torch


x = torch.randn(1,5,requires_grad=True)
print(x)
x = F.softmax(x,dim=1)
print(x)
l = 0
for i in range(5):
    l = l + x[0][i]

print(l)
l.backward()
print(x.grad)复制代码

此时的x的梯度为None:

tensor([[ 1.0408,  0.5212,  0.2902, -0.7637, -0.7276]], requires_grad=True)
tensor([[0.4163, 0.2476, 0.1965, 0.0685, 0.0710]], grad_fn=<SoftmaxBackward>)
tensor(1., grad_fn=<AddBackward0>)
None复制代码

在pytorch中，我们经常需要查找tensor中某一个元素的索引，可能是在向量中查找索引，也可能是在矩阵中查找索引，下面分贝举例子：

1.在矩阵中查找某个指定元素的索引：

import torch
import numpy as np

a = torch.tensor( [[1,2,3],[4,5,6],[5,6,7],[6,7,8]] )
a_t2n = a.numpy()
index = np.argwhere( a_t2n>4 )
print(index)复制代码

运行结果如下：

[[1 1]
 [1 2]
 [2 0]
 [2 1]
 [2 2]
 [3 0]
 [3 1]
 [3 2]]复制代码

返回的结果，比如第一个[1,1]代表a_t2n[1][1]=5,是满足条件的第一个元素的索引

2.在向量中查找某个指定元素的索引：

举例子如下：

import torch
import numpy as np

a = torch.tensor( [1,2,3,4,5,5,4,7] )
a_t2n = a.numpy()
index = np.argwhere( a_t2n>4 )
print(index)复制代码

运行结果如下：

[[4]
 [5]
 [7]]复制代码

第一个结果[4]，代表a_t2n[4]=5,是第一个满足这个条件的元素的索引。

作者：Tchunren
链接：https://juejin.cn/post/7032473008581115917