标签   CNN 下的文章

YOLO简介

under 算法

滑动窗口是一种解决目标检测的简单方法,但其问题也很明显:不能输出精确的边界框,同时识别精度与滑动窗的大小相关比如在上图中由于滑动窗的选择大小不精确,就导致没有任何一个窗口中完全包含目标,同时目标边界未必是正方形或者指定的窗口大小YOLO(You Only Look Once)算法是一种能实现精...

Read More

基于滑动窗口的目标检测

under 算法

我们可以采用目标分类加定位的方法来检测图像中的单一目标,而当图像中含有多个目标时,我们就需要构建一个目标检测算法,使得图像中的所有目标同时被圈出来滑动窗口(sliding window)是目标检测使用的常用思想假设我们将构建一个汽车检测算法(把图像中的所有汽车圈出来),首先我们要把汽车图像(汽...

Read More

目标定位与特征点检测

under 算法

除分类问题外,定位问题也是神经网络要解决的目标之一如上图所示,分类问题是判断图像中的物体种类,而定位问题则是在分类的同时在图像上把目标圈出来分类问题的解决方法是通过softmax函数输出预测值,那如果想实现目标定位,就要修改一下softmax的输出在上图情境中,假设我们只要检测三类目标:行人、...

Read More

1*1卷积与GoogLeNet网络

under 算法

过滤器的大小除了常见的$3*3,5*5$等之外,在实际应用中我们也会见到$1*1$的过滤器。对于单通道的图像来说,$1*1$的过滤器没有意义,因为卷积计算后只是单纯的将图像中的信息成倍的放大或缩小而已,但对于多通道的图像,$1*1$卷积就有了独特的意义对于一个$6*6*32$的输入,当我们用$...

Read More

残差网络

under 算法

因为梯度消失和梯度爆炸问题的存在,非常深的神经网络是很难以训练的,但残差网络(ResNets)的出现打破了这一困境。实验表明,残差网络甚至可以构建到1000层以上残差网络的组成基础是跳远连接(skip connection)构成的残差块(residual block)这是一个两层的神经网络,$...

Read More