代码之家  ›  专栏  ›  技术社区  ›  tidy

为什么过滤器和要素图层具有相同数量的通道?

  •  4
  • tidy  · 技术社区  · 6 年前

    一些目标检测框架,如ssd(单镜头多盒检测器)和快速rcnn,都有卷积滤波器用于分类和回归。以下是来自ssd的

    对于具有p个通道的大小为m n的特征层,预测潜在检测参数的基本元素是一个3p小核,它产生类别的分数或相对于默认框坐标的形状偏移。在应用内核的每个m n位置,它都会产生一个输出值。

    我的问题是:“小内核”的数量必须是 ?设一个任意数如何 K (哪些与功能频道不同)?

    1 回复  |  直到 6 年前
        1
  •  2
  •   Vijay Mariappan    6 年前

    enter image description here

    在图中,部分 extra Feature layers 显示了 small kernel 提取物 p 来自每个输出位置的向量,用于预测不同位置的检测 aspect ratios class categories .

    例如,从第一卷积特征图来看,p是 (3x(classes+4)) ,第二个是 (6x(classes+4)) . 数字 3 6 表示 anchor classes + 4 box coordinates 输出。

    所以你需要修复 根据为每个要素地图确定的定位框的数量,要检测的类的数量。

    我的问题是:小颗粒的数量必须是p吗?怎么用? 关于设置任意数k(与特征不同 频道)?

    特征通道是 3x3xp 通道,因此它将始终采用大小p,这是内核的输出通道大小。并注意 3X3XP 实际上是 3 x 3 x in_channels x p ,例如,第一个特征层是通过卷积获得的 38x38x512 从带有内核的vgg 3x3x512xp 得到 38x38xp