CXH的个人站

Man is what he believes.

文章RSS 评论RSS

One-Shot与Simaese网络

under 算法

人脸识别是CNN的另一种典型应用。在人脸识别任务中,我们要完成的任务是对于任意的输入人脸图像,判断该图像是否为数据库中某一人的照片。但由于实际应用的限制,我们往往只能获取某人的单张照片作为数据集,通过单张数据训练模型来进行人脸识别的问题就被称为One-Shot问题上图即为One-Shot问题的...

Read More

IoU与NMS

under 算法

在目标定位中,我们如何判定定位效果的好坏呢,我们使用的估值函数为交并比(Intersection over Union)在上图中红色框是目标的准确位置,假设紫色框是我们的预测位置,那他们的并集就是绿色的部分,交集是黄色的部分,IoU为$$ \frac{size\ of\ Intersectio...

Read More

YOLO简介

under 算法

滑动窗口是一种解决目标检测的简单方法,但其问题也很明显:不能输出精确的边界框,同时识别精度与滑动窗的大小相关比如在上图中由于滑动窗的选择大小不精确,就导致没有任何一个窗口中完全包含目标,同时目标边界未必是正方形或者指定的窗口大小YOLO(You Only Look Once)算法是一种能实现精...

Read More

基于滑动窗口的目标检测

under 算法

我们可以采用目标分类加定位的方法来检测图像中的单一目标,而当图像中含有多个目标时,我们就需要构建一个目标检测算法,使得图像中的所有目标同时被圈出来滑动窗口(sliding window)是目标检测使用的常用思想假设我们将构建一个汽车检测算法(把图像中的所有汽车圈出来),首先我们要把汽车图像(汽...

Read More

目标定位与特征点检测

under 算法

除分类问题外,定位问题也是神经网络要解决的目标之一如上图所示,分类问题是判断图像中的物体种类,而定位问题则是在分类的同时在图像上把目标圈出来分类问题的解决方法是通过softmax函数输出预测值,那如果想实现目标定位,就要修改一下softmax的输出在上图情境中,假设我们只要检测三类目标:行人、...

Read More