我有一个
tf.data.Dataset
包含3个不同功能的实例
-
label
这是一个标量
-
sequence_feature
这是一个标量序列
-
seq_of_seqs_feature
这是一个序列特征
我正在尝试使用
tf.data.Dataset.padded_batch()
生成填充数据作为我的模型的输入,我想以不同的方式填充每个特性。
批次示例:
[{'label': 24,
'sequence_feature': [1, 2],
'seq_of_seqs_feature': [[11.1, 22.2],
[33.3, 44.4]]},
{'label': 32,
'sequence_feature': [3, 4, 5],
'seq_of_seqs_feature': [[55.55, 66.66]]}]
预期输出:
[{'label': 24,
'sequence_feature': [1, 2, 0],
'seq_of_seqs_feature': [[11.1, 22.2],
[33.3, 44.4]]},
{'label': 32,
'sequence_feature': [3, 4, 5],
'seq_of_seqs_feature': [[55.55, 66.66],
0.0, 0.0 ]}]
正如您所看到的
标签
不应填充功能,并且
sequence\u功能
和
seq\u of\u seqs\u功能
应使用给定批次中相应的最长条目进行填充。