文章总数
1
代码之家
› 用户
›
Juble
全部
在将attention_mask添加到模型中并微调gemma2后,损失变为Nan
Juble
·
技术社区
·
loss
pytorch-lightning
huggingface-transformers
nan
python
· 5 月前
1