一种去水印的营业执照识别方法

营业执照识别,主要包括图片去水印,图片中文字检测,图片文字块的识别。
这里写图片描述web

pix2pixHD图像去水印算法

这里写图片描述

这里写图片描述
这里写图片描述
a.制做须要的水印图片,获取相应的水印信息,如倾斜,大小比率,颜色,图片中水印与水印的距离等。收集相应的没有水印的营业执照图片;
b.搭建pix2pixHD模型,修改相应训练参数;
c.对于输入的图像,添加水印合成模块,设置透明度,倾斜等信息,将制做好的水印覆盖到图片相应的位置;
d.执行网络,获得输出图片,计算损失函数值,更新网络;
e.重复c,d步骤,直至网络收敛,训练完成;网络

图片文字块检测svg

这里写图片描述
A.采用vgg-16网络提取特征;
B. 类别的标定:双向LSTM层判断是否为文字块rpn_score,并获取与真实文字块距离的信息rpn_bbox;
C.经过rpn_score及rpn_bbox信息获取图片中文字块的信息;函数

图片文字块识别翻译

A.训练样本的生成,收集营业执照图片,利用CTPN算法检测到文字块区域,利用边缘检 测算法检测到图片边缘及非平滑区域。将这两种区域的像素点用周围范围内的非该区域的点的平均值替换掉,左右写入文字的背景图片;;
B.特征提取,5Conv+3MaxPooling+3Bn,利用卷积获取局部信息,在更高层将局部的信息综合起来就获得了全局的信息;利用pooling进行降维操做;
C.序列的标定:双向LSTM层得到属于每一个类别的几率;
D.翻译层:去除重复的识别结果及非字符;3d

图像去水印效果图:xml

这里写图片描述这里写图片描述这里写图片描述这里写图片描述这里写图片描述这里写图片描述

营业执照检测识别效果blog

这里写图片描述这里写图片描述这里写图片描述这里写图片描述这里写图片描述这里写图片描述