我正在训练一个融合网络。我现在得到了训练精度的这种波动。我不完全确定这意味着什么。我读过一些答案,其中说这是因为类别之间的边界正在切换,这导致模型在正确分类某些项目之间进行交换。我现在也在用一些增强数据扩展训练集,但仍然对此非常担心。
我的训练集相当小,只有348张图片。这让我担心,这可能是过度拟合的迹象。训练集的损失继续下降,当验证损失通过提前停止趋于平稳时,我停止了训练。测试结果相当不错,但我只是担心这种波动。
编辑:该模型使用Adam优化器最小化分类交叉熵。
编辑2:损失
编辑3:将增强图像添加到训练集/测试集/验证集后,它会平滑:
增强前后的图片,想知道为什么第一张图片包含如此多的波动。