vhpg's Blog

You got a dream, you gotta to protect it.

CNN Model - SENet

论文分析

本篇文章观点仅限于目前的理解,后续若有新的理解,还会继续更新。 1. Introduce SENet是CVPR2017上的一篇文章中提出来的,该网络获得了ILSVRC2017的Classification任务的冠军。 SENet的motivation是如何加强feature map各通道之间的联系,使得在一个中feature map能够提高信息量较大的channel所占的比重而削...

CNN Model - ResNeXt

论文分析

本篇文章观点仅限于目前的理解,后续若有新的理解,还会继续更新。 1. Introduce ResNeXt是在2017年CVPR上的一篇文章中提出的,该网络获得了ILSVRC-2016的Classification任务的第二名(当年的第一名没有发paper,貌似只是对已有网络进行优化)。 在进行ResNeXt的设计时,作者主要借鉴了VGGNet/ResNet和Inception结构...

CNN Model - Xception

论文分析

本篇文章观点仅限于目前的理解,后续若有新的理解,还会继续更新。 1. Introduce Xception是2017年CVPR上的一篇文章中提出的,作者在Google提出的一系列Inception结构的基础上进行了进一步的发展,将其与基于深度的分离卷积相结合,提出了Extreme Inception,即Xception。 本文首先介绍Depth-wise separable co...

CNN Model - DenseNet

论文分析

本篇文章观点仅限于目前的理解,后续若有新的理解,还会继续更新。 1. Introduce DenseNet于2017年CVPR上的一篇论文中提出,该网络是对ResNet等跳层连接的网络的进一步发展,作者提出了一种稠密残差连接的模块,并据此构建出较深的网络结构,取得了不错的效果。 如下图所示,为一个稠密残差连接的模块的示意图,在图中,X_0为输入,其后各层为卷积后的特征图: 该模块...

Object Detection - Mask R-CNN

论文分析

本篇文章观点仅限于目前的理解,后续若有新的理解,还会继续更新。 0. Introduce Mask R-CNN是在Faster R-CNN的基础上进行的改进,可在同时完成目标定位和实例分割。 下图是Faster R-CNN的结构示意图: Mask R-CNN在最后又添加了分支,该分支对每个RoI生成相应的二进制掩膜binary mask,对每个RoI,该分支的输出为Km^2,...

Object Detection - Faster R-CNN

论文分析

本篇文章观点仅限于目前的理解,后续若有新的理解,还会继续更新。 1. Introduce 在Fast R-CNN中,检测一张图片一共需要2.3s,但是有2s的时间是用于Selective Search方法产生候选框,主要是因为Selective Search方法不能使用GPU加速。 针对该问题,作者提出Faster R-CNN,整体框架如下图所示,与Fast R-CNN基本相同...

Object Detection - Fast R-CNN

论文分析

本篇文章观点仅限于目前的理解,后续若有新的理解,还会继续更新。 1. Introduce Fast R-CNN是2015年发表在ICCV中的文章中提出的,作者的目的是对R-CNN中的一些问题进行改进,对整个框架的训练进行了简化,同时提高了检测速度和精度。 R-CNN的缺点很明显: 训练不能一次完成,需要分多步进行; 在图像上提取到的候选区域,每一个都需要经过CNN网络提...

Object Detection - R-CNN

论文分析

本篇文章观点仅限于目前的理解,后续若有新的理解,还会继续更新。 0. Overview R-CNN是于2014年CVPR上的一篇文章中提出的,在此之前,传统的目标检测方法如DPM等性能提升空间已经不大,也已经出现了OverFeat这样的基于深度学习的目标检测方法,(事实上在每一届的ILSVRC比赛上,经典的CNN模型论文中都有论述关于目标检测的部分),这里作者提出了自己的基于候选框...

Deep Learning - Optimization

深度学习基础

本篇文章观点仅限于目前的理解,后续若有新的理解,还会继续更新。 文中编辑的公式,在网页上查看会有问题,可使用Atom+MarkDown插件查看(KaTex) 0. Introduce 本文对神经网络训练时常用的优化器进行总结,限于个人水平有限,无法从一个大的角度来谈深度学习中的优化问题,因此本文内容主要摘自这篇文章,并加上一些自己的理解。 总的来说,深度学习中的优化方法...

CNN Model - ResNet v1

论文分析

本篇文章观点仅限于目前的理解,后续若有新的理解,还会继续更新。 1. Introduce ResNet v1是由Kaiming He于2016年发表在CVPR上的文章Deep Residual Learning中提出的,残差学习的方法有效地解决了随着网络深度增加而造成的性能退化的问题,在这篇文章中,最深的网络深度达到了152层。 以该结构为基础的所构建的网络,赢得了ILSVRC-...