代码之家  ›  专栏  ›  技术社区  ›  Jame

我应该在最后一个卷积层使用conv 3x3进行语义分割吗?

  •  1
  • Jame  · 技术社区  · 5 年前

    在语义切分中,卷积 1x1 通常用于替换完全连接的层以维护空间信息。例如,我应该使用更大的内核大小吗 3x3 而不是 1x1 因为 3x3 内核大小将有更大的视图信息来做出最终决定。谢谢

    1 回复  |  直到 5 年前
        1
  •  2
  •   Dmytro Prylipko    5 年前

    深入学习 1x1 3x3 卷积用于不同的目的。 3x3 对应于一种方便的卷积,对输入数据应用一些滤波器。鉴于 1x1 有点像 Network in Network 从概念上讲,它接近于应用于每个像素的通道值的MLP(没有隐藏层)。它通常用于缩小或扩展特征图通道的数量(降维或扩展),因此可能对以下功能起辅助作用: 3x3 卷积: What does 1x1 convolution mean in a neural network?

    另一个众所周知的用法是 1x1 卷积是将来自不同卷积组或其极端版本(深度方向可分离卷积)的信息混合在一起: MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

    总而言之, 1x1 卷积通常与 3x3 一个。在最初的模型中,它们可能被用于某个目的,并切换到 3x3 将转变为概念。这并不一定意味着准确度会更差,事实上,它可能会改善或保持不变。

    这肯定会导致更大的计算时间。但如果你能负担得起,那就试试吧。