基于深度学习的图片文字识别技术的研究
无需注册登录,支付后按照提示操作即可获取该资料.
基于深度学习的图片文字识别技术的研究(任务书,开题报告,论文9000字)
摘 要
文字识别主要包括图像预处理、字符特征的提取、图像的输入、字符的预识别和文本信息的后处理。神经网络识别法是目前主要的文字识别技术之一。在实践中,它通常是和其他文字识别技术相互结合使用的。
卷积神经网络是由隐藏层和输出层组成可以并行、高速地处理数据的前馈神经网络。它以其快速的学习收敛性而备受关注。自学习、自组织、自适应是它最显著的特点。
本文研究和分析了字符识别的相关技术和神经网络技术,同时对常用的图形和字符提取算法进行了比较和分析,设计并实现了一种复杂图像的布局分析算法。使用OpenCV算法和相关的先验知识对段落和行进行分段。最后,利用投影和贪婪算法对字符进行分割,形成图形和文本信息。实现了一种简单的卷积神经网络,系统的输入是提取对象的特征向量,通过对大量文本样本的训练,来达到实现对字符的识别的目标。
关键词:文字识别 卷积神经网络 深度学习 OpenCV
Research On Picture Recognition Technology Based On Deep Learning
ABSTRACT
Text recognition mainly includes image input, image preprocessing, character feature extraction, character pre-identification, and post-processing of text information. Neural network recognition is one of the main text recognition technologies. In practice, it is often used in conjunction with other text recognition technologies.
Convolutional neural network is a feedforward neural network, which consists of a hidden layer and an output layer. It can process data in parallel and at high speed. It has received much attention for its rapid learning convergence. Self-learning, self-organization, and self-adaptation are its most prominent features.
This paper studies and analyzes the related techniques of text recognition and neural network technology. At the same time, it compares and analyzes commonly used graphics and character extraction algorithms, and designs and implements a layout analysis algorithm for complex images. Segments and lines are segmented using the OpenCV algorithm and related prior knowledge. Finally, the projection and greedy algorithms are used to segment the characters to form graphics and text information. A simple convolutional neural network is implemented. The input of the system is to extract the feature vector of the object. Through training a large number of text samples, the target of text recognition can be achieved.
Key words: text recognition; deep learning; Convolutional neural network; OpenCV.
目 录
摘 要 I
ABSTRACT II
第一章 绪论 1
1.1课题研究的背景与意义 1
1.2国内外研究现状 1
1.3本文的主要工作 2
第二章 深度学习理论 3
2.1深度学习简介 3
2.2卷积神经网络简介 3
2.2.1卷积运算 3
2.2.2神经网络 4
2.3卷积神经网络的基本结构 5
2.3.1卷积层 6
2.3.2池化层 6
2.3.3激活层 7
2.3.4全连接层 8
第三章 神经网络的构建及训练 9
3.1卷积神经网络模型的训练 9
3.1.1数据集的构建 9
3.1.2网络模型的训练 10
3.2卷积神经网络服务的构建 11
3.2.1 TensorFlow模型持久化 11
3.2.2使用socket网络服务提供接口 11
3.3卷积神经网络的部分代码 12
第四章 图像处理 14
4.1图像前期处理 14
4.1.1图像灰度化 15
4.1.2图像二值化 15
4.2倾斜校正 15
4.2.1基于傅里叶变换和霍夫变换的图像矫正 16
4.2.2基于文本轮廓的矩形矫正 16
4.3表格框线处理 18
4.3.1形态学转换 18
4.3.2交点分析 19
4.3.3构建掩模 19
4.4图像版面分析及分割 20
4.4.1轮廓检测 20
4.4.2宽度优先策略 21
4.4.3最大空白区域法 22
4.5字符分割 23
4.5.1投影处理 23
4.5.2 Beam Search算法分割 24
4.6实验结果 25
4.6.1单字符识别结果 25
4.6.2纯文本识别结果 26
4.6.3复杂文本识别结果 27
总结与展望 29
参考文献 30
致 谢 32