为方便浏览本博客的信息,建立了博客导航。
InstanceFCN:Instance-sensitive Fully Convolutional Networks
这篇文章发表于2016年,提出了一种全卷积网络,可以计算一组实例敏感的分数图,每一个分数图都是实例中一个相对位置上每个像素分类的结果。之后实例敏感的分数图经过一个简单的组合模块,输出每一个位置的候选实例。
FCIS:Fully Convolutional Instance-aware Semantic Segmentation
这篇文章发表于2016年,提出了第一个端到端的实例分割模型,同时检测和分割实例。通过引入位置敏感的内/外分数图,底层的卷积表达被两个子任务以及所有的感兴趣区域完全地共享。
FCN:Fully Convolutional Networks for Semantic Segmentation
这篇文章发表于2015年,提出了使用全卷积网络解决语义分割任务,达到像素级的分类结果。
DetNet:A Backbone network for Object Detection
这篇文章发表于2018年,现有的目标检测框架通常都是使用图像分类网络作为基础网络,但是图像分类与目标检测任务之间有几点不同:(1)像FPN,RetinaNet为了实现不同尺度目标的检测,图像分类网络通常涉及额外的阶段;(2)大的下采样因子带来的大的感受野,这对图像分类任务有利,但是会降低检测任务的性能。因此,这篇文章提出的DetNet是一种新的专门为目标检测任务设计的backbone网络。
Mask^X R-CNN:Learning to Segment Every Thing
这篇文章建立在Mask R-CNN上,提出了一种新的半监督训练和权重迁移方程。在类别数量很大的训练集上每个图像中的实例都有box标记,但是只有一小部分有掩码标记,这篇文章提出的方法可以在这样的数据集上训练实例分割模型。主要的贡献就是训练Mask R-CNN去检测和分割3000种实例,box标记使用Visual Genome数据集,掩码标记来自于COCO数据集的80个类别。
Mask-R-CNN
这篇论文提出了一种概念简单,灵活且通用的目标实例分割框架,在检测出图像中目标的同时,生成每一个实例的掩码(
mask
)。对Faster R-CNN
进行扩展,通过添加与已存在的bounding box
回归平行的一个分支,预测目标掩码,因而称为Mask R-CNN
。这种框架训练简单,容易应用到其他任务,比如目标检测,人体关键点检测。
Feature Pyramid Networks for Object Detection
这篇文章提出特征金字塔网络(FPN),将分辨率高语义性弱的浅层特征和分辨率低语义性强的深层特征融合,形成了多级金字塔,在金字塔每一级上独立检测目标。FPN不仅对多尺度的目标检测具有很好的效果,还可以应用到分割任务中。