这篇论文发表在
NIPS2015
上。region proposal
计算出现瓶颈,因此引入RPN
网络,与检测网络共享整幅图像的的卷积特征,所以region proposal
几乎是没有代价的。Faster R-CNN
能够达到实时,并且精确度高。
Fast-R-CNN
这篇文章发表在
ICCV2015
上,为了改进R-CNN
,SPPnet
多阶段训练的缺点,以及SPPnet
限制了误差的反向传播的缺点,提出了Fast R-CNN
。在训练过程中,使用multi-task loss
简化了学习过程并且提高了检测准确率。
SPPNet:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
为了解决现有
CNN
需要固定输入大小的问题,提出了SPP-net
,使得针对任意尺寸的图像生成固定长度的特征表示。输入一张图,只需要对整张图进行一次feature map
的计算,避免了像R-CNN
那样重复地计算卷积特征。SPP-net
不仅可以应用在分类任务上,而且在检测任务上也有很大的性能提升。
R-CNN:Rich feature hierarchies for accurate object detection and semantic segmentation
这篇文章发表在
CVPR2014
上面,是第一篇展示CNN
可以在PASCAL VOC
数据集上带来明显更好的目标检测性能的文章。提出了一种使用selective search
+CNN
的两阶段的目标检测方法。创新点在于使用CNN
提取特征,在大数据集下有监督的预训练,小数据集上微调解决样本数量少难以训练的问题。