小田学CV掉头发之路——基于滑动窗口HOG(Histogram of Gradient)的目标检测

什么是目标检测

给定一张图片可以识别出类别,就是对象类别,但目标检测除了要识别目标外还要找到他们在图像中的位置。

image-20201104171237063

显然,目标检测比对象识别更难。

传统的机器视觉领域,通常采用特征描述子来应对目标识别任务,这些特征描述子最常见的就是 SIFTHOG

基于滑动窗口HOG(Histogram of Gradient)的目标检测

详细内容请看论文,因为这个算法用的不多,所以只做简单介绍

http://lear.inrialpes.fr/people/triggs/pubs/Dalal-cvpr05.pdf

1600842231352

将图像使用向量表达

1600842400981

流程

  • 图像预处理(利用滑动窗口获得的一小块图像,统一大小,色彩强度)
  • 计算图像每一个像素点位置的梯度方向和大小
  • 将图像分为8*8像素的模块,使用HOG计算此模块的向量表达式(向量长度为9)
  • 将4个(2*2)相邻的模块的HOG向量连接为一个长度为36的向量,并且正则化使得其为单位向量
  • 将所有长度为36的向量连接在一起成为图像向量
  • 将图像向量作为分类器(例如SVM)的输入,训练和分类

向量作为分类器(例如SVM)的输入,训练和分类