代码之家 › 专栏 › 技术社区 › sachinruk

使用src_key_padding_mask时出现意外输出

pytorch

sachinruk · 技术社区 · 3 年前

我想我理解的用法 src_key_padding_mask 幸亏 Difference between src_mask and src_key_padding_mask 。然而,我期待着 src_key_padding_mask 以使输出为零或掩码值的负无穷大。只是想知道我是否正确使用了它,或者是否需要修改下面的代码片段。

请注意,我知道我需要使用位置编码,并且我没有故意使用它。

import random
import torch
import torch.nn as nn
from torch.nn.utils.rnn import pad_sequence 

random.seed(42)
torch.manual_seed(42)
DIM = 5
BATCH = 2

x = [torch.randn(random.randint(1, 3), DIM) for _ in range(2)]
mask = pad_sequence([torch.LongTensor([1]*len(elem)) for elem in x]) == 0
padded_x = pad_sequence(x)

encoder_layer = nn.TransformerEncoderLayer(d_model=DIM, nhead=1)
encoder = nn.TransformerEncoder(encoder_layer, num_layers=2).eval()

# the output of the following two are the same except for where it is masked. I was expecting zeros:
out1 = encoder(padded_x, src_key_padding_mask=mask.T)
out2 = encoder(padded_x)

0 回复 | 直到 3 年前

MWB 3 年前

我期待着 src_key_padding_mask 以使输出为零或掩码值的负无穷大。

输出值仍在计算中,并且对于所有时间步长来说都是不平凡的。只是没有一个输出应该依赖于屏蔽的时间步长(您可以通过调整输入并观察哪些输出发生变化来检查这一点)

推荐文章

Ze0ruso · 做模型。eval()在代码中的位置有什么关系?

2 年前

rkraaijveld · sklearn的Coef。线性回归为无

2 年前

Ellis Thompson · 填充一个numpym数组以满足所需的大小

3 年前

Adam · 如何在多个模型上并行运行PyTorch推理?

3 年前

quinlan · 是dgl。nn。皮托克。GraphConv聚合边缘信息?

3 年前

Ofek Nourian · 完全连通的简单自回归模型预测

3 年前

MrThiele1708 · 运行时错误:mat1和mat2形状不能相乘(5400x64和5400x64)

3 年前

Moodhi · 计算GEC的F分数

3 年前

john wang · matlab使用可调用的python函数,但需要输入

3 年前

odbhut.shei.chhele · 如何解决错误:RuntimeError:收到0项ancdata

3 年前