前言: python
视觉测距做为机器视觉领域内基础技术之一而受到普遍的关注,其在机器人领域内占有重要的地位,普遍应用于机器视觉定位、目标跟踪、视觉避障等。机器视觉测量主要分为:单目视觉测量、双目视觉测量、结构光视觉测量等。结构光因为光源的限制,应用的场合比较固定;双目视觉难点在于特征点的匹配,影响了测量的精度和效率,其理论研究的重点集中于特征的匹配上;而单目视觉结构简单,运算速度快而具备广阔的应用前景。
数组
今天看到一篇博客提到一种简单粗暴的单目视觉测距方法,文章地址以下文章地址。在这里呢,本身尝试把他复现了一下,过程不难,十分简单,不过呢,精度也凑合。ide
1、测距原理 函数
单目视觉测距是利用一个摄像机得到的图片得出深度信息,按照测量的原理主要分为基于已知运动和已知物体的测量方法。字体
已知物体的测量方法是指在已知物体信息的条件下利用摄像机得到的目标图片获得深度信息。此类方法主要应用于单目视觉进行导航和定位,该类方法的缺点是利用单个特征点进行测量,容易因特征点提取的不许确性,产生偏差。 this
咱们采用摄像头采集图片,将三维场景投影到摄像机二维像平面上。对于测量地球坐标系中的物体而言,小孔成像模型(也称为线性摄像机模型)基本能够知足测量的要求,即任意点p1 在图像中的投影位置p2为光心Oc与 p1点的连线与图像平面的交点,以下图所示:spa
现实中的物体的成像咱们也能够表示为以下所示:.net
据此,咱们将使用类似三角形来计算相机到一个已知的物体或者目标的距离。3d
类似三角形就是这么一回事:假设咱们有一个宽度为 W 的目标或者物体。而后咱们将这个目标放在距离咱们的相机为 D 的位置。咱们用相机对物体进行拍照而且测量物体的像素宽度 P 。这样咱们就得出了相机焦距的公式:code
举个例子,假设我在离相机距离 D = 24 英寸的地方放一张标准的 8.5 x 11 英寸的 A4 纸(横着放;W = 11)而且拍下一张照片。我测量出照片中 A4 纸的像素宽度为 P = 249 像素。
所以个人焦距 F 是:
当我继续将个人相机移动靠近或者离远物体或者目标时,我能够用类似三角形来计算出物体离相机的距离:
为了更具体,咱们再举个例子,假设我将相机移到距离目标 3 英尺(或者说 36 英寸)的地方而且拍下上述的 A4 纸。经过自动的图形处理我能够得到图片中 A4 纸的像素距离为 170 像素。将这个代入公式得:
或者约 36 英寸,合 3 英尺。
从以上的解释中,咱们能够看到,要想获得距离,咱们就要知道摄像头的焦距和目标物体的尺寸大小,这两个已知条件根据公式:
得出目标到摄像机的距离D,其中P是指像素距离,W是A4纸的宽度,F是摄像机焦距。
接下来,是经过预先拍照,根据第一张照片算出摄像头的焦距,在根据已知的焦距算出接下来的照片中白纸到摄像机的距离。
2、演示代码
#!usr/bin/python # -*- coding: utf-8 -*- ########利用三角形类似原理进行简单单目测距######### # author:行歌 # email:1013007057@qq.com import numpy as np import cv2 # initialize the known distance from the camera to the object, # which in this case is 24 inches KNOWN_DISTANCE = 24.0 # initialize the known object width, which in this case, # the piece of paper is 11 inches wide KNOWN_WIDTH = 11.69 KNOWN_HEIGHT = 8.27 # initialize the list of images that we'll be using IMAGE_PATHS = ["Picture1.jpg", "Picture2.jpg", "Picture3.jpg"] def find_marker(image): gray_img = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # 将彩色图转化为灰度图 gray_img = cv2.GaussianBlur(gray_img, (5, 5), 0) # 高斯平滑去噪 edged_img = cv2.Canny(gray_img, 35, 125) # Canny算子阈值化 # cv2.imshow("edged_img",edged_img) img, countours, hierarchy = cv2.findContours(edged_img.copy(), cv2.RETR_LIST,cv2.CHAIN_APPROX_SIMPLE) # 注意,findcontours函数会“原地”修改输入的图像。opencv3会返回三个值,分别是img, countours, hierarchy # 第二个参数表示轮廓的检索模式,cv2.RETR_EXTERNAL表示只检测外轮廓;v2.RETR_LIST检测的轮廓不创建等级关系 # cv2.RETR_CCOMP创建两个等级的轮廓;cv2.RETR_TREE创建一个等级树结构的轮廓。 # 第三个参数method为轮廓的近似办法,cv2.CHAIN_APPROX_NONE存储全部的轮廓点, # 相邻的两个点的像素位置差不超过1,即max(abs(x1 - x2),abs(y2 - y1)) == 1 # cv2.CHAIN_APPROX_SIMPLE压缩水平方向,垂直方向,对角线方向的元素,只保留该方向的终点坐标, # 例如一个矩形轮廓只需4个点来保存轮廓信息 # cv2.drawContours(image,countours,-1,(0,0,255),2,8) # # 第三个参数指定绘制轮廓list中的哪条轮廓,若是是-1,则绘制其中的全部轮廓。 # # cv2.imshow('image', image) # print(len(countours)), # 输出以下:15,即该图检测出15个轮廓 c = max(countours, key = cv2.contourArea) # 提取最大面积矩形对应的点集 rect = cv2.minAreaRect(c) # cv2.minAreaRect()函数返回矩形的中心点坐标,长宽,旋转角度[-90,0),当矩形水平或竖直时均返回-90 # c表明点集,返回rect[0]是最小外接矩形中心点坐标, # rect[1][0]是width,rect[1][1]是height,rect[2]是角度 # box = cv2.boxPoints(rect) # # 可是要绘制这个矩形,咱们须要矩形的4个顶点坐标box, 经过函数cv2.boxPoints()得到, # # 即获得box:[[x0, y0], [x1, y1], [x2, y2], [x3, y3]] # # print(box),输出以下: # # [[508.09482 382.58597] # # [101.76947 371.29916] # # [109.783356 82.79956] # # [516.1087 94.086365]] # # # 根据检测到的矩形的顶点坐标box,咱们能够将这个矩形绘制出来,以下所示: # for i in range(len(box)): # cv2.line(image, (box[i][0],box[i][1]),(box[(i+1)%4][0],box[(i+1)%4][1]),(0,0,255),2,8) # cv2.imshow('image', image) return rect def distance_to_camera(knownWidth, focalLength, perWidth): return (knownWidth * focalLength) / perWidth def calculate_focalDistance(img_path): first_image = cv2.imread(img_path) # cv2.imshow('first image',first_image) marker = find_marker(first_image) # 获得最小外接矩形的中心点坐标,长宽,旋转角度 # 其中marker[1][0]是该矩形的宽度,单位为像素 focalLength = (marker[1][0] * KNOWN_DISTANCE) / KNOWN_WIDTH # 获取摄像头的焦距 print('焦距(focalLength )= ',focalLength) # 将计算获得的焦距打印出来 return focalLength def calculate_Distance(image_path,focalLength_value): # 加载每个图像的路径,读取照片,找到A4纸的轮廓 # 而后计算A4纸到摄像头的距离 image = cv2.imread(image_path) cv2.imshow("image", image) cv2.waitKey(300) marker = find_marker(image) distance_inches = distance_to_camera(KNOWN_WIDTH,focalLength_value, marker[1][0]) # 计算获得目标物体到摄像头的距离,单位为英寸, # 注意,英寸与cm之间的单位换算为: 1英寸=2.54cm box = cv2.boxPoints(marker) # print( box ),输出相似以下: # [[508.09482 382.58597] # [101.76947 371.29916] # [109.783356 82.79956] # [516.1087 94.086365]] box =np.int0( box) # 将box数组中的每一个坐标值都从浮点型转换为整形 # print( box ),输出相似以下: # [[508 382] # [101 371] # [109 82] # [516 94]] cv2.drawContours(image, [box], -1, (0, 0, 255), 2) # 在原图上绘制出目标物体的轮廓 cv2.putText(image, "%.2fcm" % (distance_inches * 2.54), (image.shape[1] - 300, image.shape[0] - 20), cv2.FONT_HERSHEY_SIMPLEX, 2.0, (0, 0, 255), 3) # cv2.putText()函数能够在照片上添加文字 # cv2.putText(img, txt, (int(x),int(y)), fontFace, fontSize, fontColor, fontThickness) # 各参即为:照片/添加的文字/左上角坐标/字体/字体大小/颜色/字体粗细 cv2.imshow("image", image) if __name__ == "__main__": img_path = "Picture1.jpg" focalLength = calculate_focalDistance(img_path) # 得到摄像头焦 for image_path in IMAGE_PATHS: calculate_Distance(image_path,focalLength) cv2.waitKey(1000) cv2.destroyAllWindows()
运行程序,结果以下:
对于图像一:
对于图像二:
对于图像三: