卷积神经网络与图像边缘检测

这一周主要是学习了下滤波器运算与图像的边缘检测,这里做一个简单的总结
边缘检测总结图

数字图像的邻域与连通

  • 4邻域:像素p坐标为(x, y),其4领域是(x + 1, y), (x - 1, y), (x, y + 1), (x, y - 1)。对于在像素点p的4邻域内的像素均与像素点p形成4连通
  • D邻域:像素p坐标为(x, y), 其D领域是(x + 1, y + 1), ( x + 1, y - 1), (x - 1, y + 1),(x - 1, y - 1)
  • 8邻域:将4领域与D领域的集合取并集,即表示为8邻域。对于在像素点p的8邻域内的像素均与像素点p形成8连通

滤波

滤波的两个主要目的:

  1. 提取图像特征,简化图像所带的信息
  2. 消除图像数字化时所混入的噪声

滤波器运算:滤波器在图像上进行从上到下,从左到右的遍历,计算滤波器与对应像素的值,并根据滤波目的进行数值计算,返回值到当前像素点。

滤波器运算/卷积运算

垂直/水平边缘检测

通过沿X轴方向的垂直滤波器,来找到图像的垂直边缘。
垂直边缘检测
垂直和水平边缘检测

梯度

梯度是由全部变量计算的偏导数汇总而成的向量,其指向函数的最小处。

图像的梯度是当前像素点相对于X轴、Y轴的偏导数,可以简单的理解为沿着在X、Y方向上进行差分计算。

在卷积神经网络中,滤波器的值是作为权重,需要通过反向传播方法来进行学习推理得到的。
深度学习与边缘检测

边缘检测算子(滤波器)

一阶

  • Roberts Cross算子
    Roberts Cross算子

  • Sobel算子
    Sobel算子

  • Prewitt算子
    Prewitt算子

二阶

  • Canny算子
  • Laplacian算子

参考

「滤波器」涉及卷积计算原理和边缘检测算子相关知识,属于“数字图像处理“部分的内容,参考文章:数字图像处理:边缘检测(Edge detection) - 知乎

吴恩达的「深度学习课程」把卷积运算、滤波器和边缘检测讲的非常简单易懂,很适合初学者:C4W1L02 Edge Detection Examples - YouTube