代码之家 › 专栏 › 技术社区 › konchy

为什么我们称CNN中的完全连接层为“顶层”?

terminology conv-neural-network deep-learning neural-network machine-learning

konchy · 技术社区 · 7 年前

我读过一些关于卷积神经网络的论文,发现几乎所有的论文都将正常CNN中的完全连接层称为“顶层”。

然而,正如大多数论文所示,典型的CNN具有自上而下的结构,并且完全连接的层(后面通常是softmax分类器)放在网络的底部。那么,为什么我们称之为“顶层”?这是一种惯例还是有其他一些我不知道的考虑?

2 回复 | 直到 7 年前

Maxim 7 年前

我认为这只是品味的问题,但是说“顶层”与神经网络中的“头”概念相关。人们说“分类头”和“回归头”是指神经网络的输出层(该术语用于 tf.estimator.Estimator ,另请参阅一些讨论 here here 顶部一个,而输入层是底部 . 无论如何,当被称为“顶部”时,您应该仔细检查特定层的含义。

Lukasz Tracewski 7 年前

有一个很好的理由将它们和其他层区别开来,远远超出“约定”。

想象一下,现在你想建立自己的模型来识别可爱的猫,而不仅仅是猫。如果你从头开始,你必须提供大量的训练示例,以便模型首先学会识别猫的组成部分。通常情况下,您没有足够的数据量或足够的处理能力。您可能会做什么:

以现有的、性能良好的模型为例,该模型在ImageNet上具有已学习的权重。有一些惊人的,最先进的模型在那里,培训了数百万的图像。你很难打败ILSVRC比赛的获胜者。
移除顶层。您对原始模型学习到的所有标签都不感兴趣。
固定借用模型的权重。它已经很擅长识别猫了,你不想通过训练来增加体重。
添加你自己的顶层,在可爱的猫身上训练模特。

背后的想法是,原始模型已经学会识别CNN层中的通用特征,并且这些特征可以重用。顶层已经超越了泛型,变成了训练集中的特定片段,这些片段可以被丢弃。那里没有可爱的猫。

推荐文章

Ze0ruso · 做模型。eval()在代码中的位置有什么关系?

2 年前

Joseph · 重塑BatchDataset训练模型的输入-Tensorflow

2 年前

Palkin Jangra · 如何迭代一列以获得每行的平均值?

3 年前

Ofek Nourian · 完全连通的简单自回归模型预测

3 年前

Antonin Lemoine · 用于改进颜色检测的图像处理(python)

3 年前

chao · 如何提取和存储自动语音识别深度学习应用程序生成的文本

3 年前

Jack Arnestad · 使用预训练单词嵌入对单词“池”进行分类

6 年前

user9851027 · 强化学习、深度学习和深度强化学习之间有什么区别?

6 年前

Atul Balaji · TypeError:保存时write()参数必须是str,而不是bytes。npy文件

6 年前

yuhengd · LSTM如何使用单词嵌入进行文本分类,例如在Keras中

6 年前