小田学CV掉头发之路——基于滑动窗口HOG(Histogram of Gradient)的目标检测

时间 2021-06-09 标签计算机视觉

什么是目标检测

给定一张图片可以识别出类别，就是对象类别，但目标检测除了要识别目标外还要找到他们在图像中的位置。

显然，目标检测比对象识别更难。

传统的机器视觉领域，通常采用特征描述子来应对目标识别任务，这些特征描述子最常见的就是 SIFT 和 HOG。

基于滑动窗口HOG(Histogram of Gradient)的目标检测

详细内容请看论文，因为这个算法用的不多，所以只做简单介绍

http://lear.inrialpes.fr/people/triggs/pubs/Dalal-cvpr05.pdf

将图像使用向量表达

流程

图像预处理（利用滑动窗口获得的一小块图像，统一大小，色彩强度）
计算图像每一个像素点位置的梯度方向和大小
将图像分为8*8像素的模块，使用HOG计算此模块的向量表达式（向量长度为9）
将4个（2*2）相邻的模块的HOG向量连接为一个长度为36的向量，并且正则化使得其为单位向量
将所有长度为36的向量连接在一起成为图像向量
将图像向量作为分类器（例如SVM）的输入，训练和分类

向量作为分类器（例如SVM）的输入，训练和分类