代码之家  ›  专栏  ›  技术社区  ›  Nima

卡夫:这两个网络有什么区别?

  •  2
  • Nima  · 技术社区  · 6 年前

    我很想知道网络1和网络2的区别是什么?他们都有带16个过滤器的conv。

    问:1和2中的16个习得过滤器是否不同?为什么?各自的优缺点?
    enter image description here

    1 回复  |  直到 6 年前
        1
  •  2
  •   Shai    6 年前

    假设

    • 重量相同 in_c conv16的x16x3x3内核被分成两部分 因纽克 x8x3x3内核,每个conv8层一个)。
    • "Dropout"

    然后两个网络计算相同的输出。但是,我怀疑第一个选项更有效(计算 im2col 仅一次,无需复制/移动数据等。)

    然而,在考虑 “辍学” ,这两个选项不再等效,因为对于所有16个经过训练的过滤器,conv16的退出模式是相同的,这两个conv8参见 不同的 在训练期间辍学,因此可能学习不同的内核。