深度学习教程之卷积网络

上页

   作为最后一个深度学习架构,让我们看看卷积网络convolutional networks,一个特别有趣的和特殊类的前馈网络,非常适合图像识别。

   在我们了解卷积网络的实际结构之前,我们首先定义一个图像过滤器,或者带有权重的方形区域。 过滤器应用到整个输入的图像,你会经常应用到多个过滤器。 例如,对于一个给定的输入图像您可以四个6 x6过滤器。 输出像素坐标1, 1是一个6 x6输入像素左上角1,1方形区域的加权和过滤波器的权重(这也是6 x6广场)。 输出像素2,1是输入方形左上角2,1的结果等等。

   网络是由下面属性定义:

  • 卷积层 对输入应用许多过滤器 。 例如,图像的第一个卷积可能有四个6 x6过滤器。 一个过滤器跨图像应用的结果称为特征映射 (FM),特征映射图像的数量等于过滤器数量。 如果前面的层也是卷积,过滤器以不同的权重被应用在跨所有的FM,所以每个输入调频是连接到每个输出FM。 跨图像共享权重的背后直觉是特征不管他们在那个位置都能被侦测,而多重过滤器允许他们中每一个检测不同的特征集合。

  • 二次抽样层 减少输入的大小。 例如,如果输入由32 x32形象,层有2 x2二次抽样面积,输出值将是16 x16图像,这意味着输入图像的4 Pixel像素(每个2 x2面积)将被组合到一个输出pixel。 有多种方法二次取样,但最受欢迎的最大池max pooling 平均池average pooling 随机池stochastic pooling 

  • 最后二次抽样(或卷积)层通常是连接到一个或多个完全连接层,最后代表目标数据。

  • 培训是使用修改后的反向传播执行的,也就是获得二次取样层放入账户,然后更新卷积过滤器权重,这是基于所有应用到的过滤器的所有值。

 

   你可以看到几个卷积网络训练的例子(反向传播),见 MNIST 数据集(手写信件的灰度图像) 在这里 ,特别是在 testLeNet * (当它在相对较短的时间内达到低约2%的错误率时,建议方法 testLeNetTiny2 )。 还有一个很好的JavaScript类似网络的可视化 在这里 

下一页:深度学习教程之源码实现

机器学习流行算法一览