vhpg's Blog

You got a dream, you gotta to protect it.

Image Quality Assessment Base

图像质量评估基础-数据集/评估标准

Introduce 质量评估有图像质量评价(Image Quality Assessment, IQA)和视频质量评估(Video Quality Assessment, VQA),QA右可分为主观方法(人直接判断)和客观方法(算法判断),客观质量评估方法又分为全参考方法(Full-Reference, FR),半参考方法(Reduced-Reference, RR)和无参考方法(No Re...

PyTorch - Accelerate DataLoader

PyTorch使用笔记

Introduce 近期在使用PyTorch的过程中发现, PyTorch在图片加载和预处理上耗时较多,导致GPU的使用率波动较大,于是在网上搜集了一些加速DataLoader的方法. Use NVIDIA DALI 来源: How to speed up the data loader 安装: pip install --extra-index-url https://develope...

Deep Learning - Darknet to Keras

darknet模型转换为Keras的.h5模型

本篇文章观点仅限于目前的理解,后续若有新的理解,还会继续更新。 1. Darknet (.cfg & .weights) darknet中,网络配置存储在.cfg文件中,权重等参数存储在.weights文件中,在.weights文件中,所有参数以二进制形式存储。下面根据darknet源码来分析参数的存储顺序。 网络训练的入口为./examples/detector.c/t...

Reproduce - Mask-RCNN

论文复现

Introduce 本文记录配置Mask RCNN环境过程中遇到的一些问题。 由于某些原因,自己在这上面浪费了比较多的时间,这里进行记录。 Config Mask RCNN网页中已经给了环境配置说明: 其中,requirements.txt中的tensorflow是使用pip安装,且安装的是CPU的版本,所以自己首先考虑的是使用conda安装GPU版本的tensorflow,这样相应的...

Deep Learning - 目标检测 & 分割 -- 评估标准

Summary

0. Introduce 本篇Blog用于总结: Classification、Detection和Segmentation等任务的具体含义 不同任务或不同数据集的评估标准 基于深度学习的Classification、Detection等论文中常用的评估模型性能的指标 相关内容会随着自己的学习不断更新。 1. Task Classification Detection...

Deep Learning - 目标检测 & 分割 -- 常用数据集

Summary

0. Introduce 本篇Blog用于总结: 在Image Classification、Object Detection及Object Segmentation等视觉任务中常用的数据集 机器学习、深度学习方向的竞赛 计算机视觉、深度学习等方向的会议 AI相关的学习资料 相关内容会随着自己的学习不断更新。 1. Dataset MNIST CIFAR Ima...

CNN Model - ShuffleNet v1

论文分析

本篇文章观点仅限于目前的理解,后续若有新的理解,还会继续更新。 Introduce ShuffleNet v1是2018年CVPR上的一篇论文中提出的,作者团队为Face++(旷视科技),它提出于MobileNet v1之后,它的目的与MobileNet类似,主要是想降低计算量,便于将网络部署到计算能力有限的终端设备上。 Google对从2015年开始提出的Inception网络...

Reproduce - AlexNet

论文复现

Introduce 本文记录对AlexNet复现的流程及过程中遇到的一些问题,AlexNet网络结构使用tf.keras编写,并加载预训练权重,最终在ILSVRC-2012的验证集上做最终测试,每张图仅使用1-Crop,得到的Top-1和Top-5错误率分别为48.0%和24.1%,作者论文中使用5-Crop在该数据集上的测试结果为40.7%和18.2%。 程序源码及结果在这里。 Alex...

Deep Learning - Receptive Field

深度学习基础

本篇文章观点仅限于目前的理解,后续若有新的理解,还会继续更新。 Introduce 在CNN网络中,Receptive Field(感受野)是一个很重要的概念。当使用卷积核对原始图像进行逐层卷积时,层数越深,该层特征图上的每个特征点所对应的原图中的Receptive Field也就越大,这也表示该特征点越抽象。 对某一特征图上的特征点对应到原图中的Receptive Field,...

CNN Model - MobileNet v1&v2

论文分析

本篇文章观点仅限于目前的理解,后续若有新的理解,还会继续更新。 1. Introduce 本文涉及两篇论文,分别是2017年的MobileNet v1(貌似是2015年就做出来,但是一直没放出来,后来才放到arXiv上)和2018年CVPR的MobileNet v2。 MobileNet提出的目的是通过优化网络结构,使得在保证一定精度的情况下尽可能减少网络参数和降低计算量,以便在嵌...