什么是目标检测
给定一张图片可以识别出类别,就是对象类别,但目标检测除了要识别目标外还要找到他们在图像中的位置。
显然,目标检测比对象识别更难。
传统的机器视觉领域,通常采用特征描述子来应对目标识别任务,这些特征描述子最常见的就是 SIFT 和 HOG。
基于滑动窗口HOG(Histogram of Gradient)的目标检测
详细内容请看论文,因为这个算法用的不多,所以只做简单介绍
http://lear.inrialpes.fr/people/triggs/pubs/Dalal-cvpr05.pdf
将图像使用向量表达
流程
- 图像预处理(利用滑动窗口获得的一小块图像,统一大小,色彩强度)
- 计算图像每一个像素点位置的梯度方向和大小
- 将图像分为8*8像素的模块,使用HOG计算此模块的向量表达式(向量长度为9)
- 将4个(2*2)相邻的模块的HOG向量连接为一个长度为36的向量,并且正则化使得其为单位向量
- 将所有长度为36的向量连接在一起成为图像向量
- 将图像向量作为分类器(例如SVM)的输入,训练和分类
向量作为分类器(例如SVM)的输入,训练和分类