云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > 手写体数字识别的软件设计(毕业设计论文)

手写体数字识别的软件设计(毕业设计论文)

  • 62 次阅读
  • 3 次下载
  • 2025/5/1 4:33:06

中北大学2009届毕业设计说明书

2 手写体数字识别中预处理技术

预处理对于一个良好的识别系统不仅是一个必不可少的环节,而且是至关重要的。如果预处理处理得不够理想,会从很大程度上降低整个系统的识别率。一般手写体数字识别而言,预处理包括很多部分,如平滑、去噪、二值化、归一化、细化、形状校正、去各种类印章、背景底纹等等。由于本文主要不是针对类似于票据识别中的这种具有各种背景底色或者印章之类的数字识别,本文主要研究的是在纸(无底纹、印章等)上写的手写体数字进行识别。因此本文就省去了去除类印章、背景底纹等的这些操作。 2.1 平滑去噪

数字图像的噪声主要来源于图像的获取(数字化过程)。图像传感器的工作情况受各种因素的影响,如图像获取中的环境条件和传感元器件自身的质量。例如,使用CCD摄像机获取的图像,光照强度和传感器温度是造成图像中产生大量噪声的主要因素。除此之外对于有些传感元器件的自身质量,如手机自带的照相设备一般分辨率较低,在获取数字图像时会产生斑点噪声。

噪声对于图像的预处理非常重要,它会影响图像处理的输入、采集、处理各个环节和识别结果的全过程。特别是图像的输入、采集的噪声是十分关键的问题。如果输入不良伴有较大的噪声,滤波去噪后不能达到理想效果,将必然的严重影响处理的全过程以至最后的识别结果。噪声去除已经成为图像处理极其重要的步骤,然而现在还没有一个通用的滤波去噪方法对所有的图片适用,一般的图像预处理必须根据实际情况选择不同滤波去噪方法进行比较,最后得出最佳的滤波去噪方法。

滤波去噪的方法可以简单分为两类:频域滤波和空间域滤波。频域滤波一般采用的方法是将空间图像采用快速傅里叶变换转换成频域信息,然后再采用信号处理的滤波方法进行滤波(一般采用的有阻滤波器、带通滤波器、陷波滤波器、最佳陷波滤波器等),滤波处理后再通过傅里叶逆变换进行逆变换成空间图像信息,从而达到滤波效果。但是由于频域滤波需要频域转换后再采用滤波器滤波,其实现起来较为复杂,效率也相对较低,而空间域滤波方法速度较快、实现简单、效果很好,因此现在很多研究者中都采用空间域滤波方法对数字图像进行滤波。

对于空间域滤波算法中最常用的是平滑滤波去噪法,其主要思想为在图像空间

第 8 页 共 54 页

中北大学2009届毕业设计说明书

中借助模板对图像进行领域操作,用平均运算方法去除突然变化的点从而滤掉一定的噪声。输出图像的每一个像素的取值都是根据模板对输入像素相应领域内的像素值进行计算得到的。常见的平滑去噪方法有:n×n中值滤波器,高斯滤波器等等。

中值滤波是较为经典的一个空间域滤波算法,该算法是将一个n×n大小的模板从上到下从左到右在图像上进行移动,在对所移到的各个像素上,使用模板中所有的像素灰度值的中间值取代当前像素的灰度值:

f(x,y)?median|g(s,t)| (式2.1)

(s,t)?Sxy中值滤波器常见的有3×3和5×5大小的模板。图2.1是3×3的中值滤波器。图中M点像素的灰度等于其领域内9个(A0~A7,M)像素灰度值的中间值。

A3 A2 A1 A4 M A0 A5 A6 A7

图2.1 3×3的中值滤波器模板示意

图2.2是采用3×3的中值滤波器对带有噪声的图片进行滤波后的效果。

a) 含有噪声的图

b) 用3×3的中值滤波后的图

图2.2 中值滤波

中值滤波对于很多种随机噪声,它都有良好的去噪能力,且在相同尺寸下比起线性平滑滤波器引起的模糊较少。中值滤波器尤其对单级或双极脉冲噪声非常有效。但是本文在对图片进行二值化处理中,后期将采用基于梯度的二值化处理,在梯度二值化处理中需要采用拉普拉斯变换提取边缘特征,而拉普拉斯变换对噪声特别敏感,因此我将会采用高斯滤波器对图像进行滤波,然后再采用高斯拉普拉斯提取边缘信息。因此,需要简单介绍一下空间域的高斯平滑滤波器。

图像的高斯平滑滤波器,其滤波器的模板设计是根据高斯函数的最佳逼近的二项式展开的系数来决定。根据高斯函数的可分离性可以得到,二维高斯滤波器能用2个一维高斯滤波器逐次卷积来实现,一个沿水平方向,一个沿垂直方向。因此高斯平滑滤波器与图像简单平滑不同的是,它在对领域内像素灰度进行平均时,给与

第 9 页 共 54 页

中北大学2009届毕业设计说明书

了不同位置的像素不同的权值。常见的高斯模板(3×3)如图2.3所示,模板上越靠近领域中心的位置,其权值越高,如此安排权值的意义在于用此模板进行图像平滑时,在对图像细节进行模糊的同时,可以更多的保留图像总体的灰度分布特征。

图2.3 3×3高斯模板

1 2 1 2 4 2 1 2 1 高斯滤波器相对简单平滑滤波器的效率较低(需要额外乘法运算),在离散型杂点的消除方面,高斯平滑的效果并不理想。然而在保留图像的总体特征上,高斯滤波器表现了很好的性能。 2.2 二值化

二值图像是指整幅图像页面内仅有黑(像素值为0),白(像素值为1)的二值图像。一般的文字识别的文字图像、进行指纹识别的指纹图像,大多数都需要将灰度图像转化成二值图像。

在数字图像处理中,二值化占有非常重要的地位。这是因为,一方面类似于字符、指纹、工程图等图像本身就是二值的。另一方面,在某些情况下即使图像本身是有灰度的,也将其转换成二值图像再处理。这样在图像处理系统中,可以减少图像信息并提高处理速度。

图像的二值化有几种类型,其中主要的有基于灰度分布的二值化,也有基于梯度信息的二值化。基于灰度分布的二值化处理一般是通过设定阈值,把它变为仅用二值表示前景和背景颜色的图像。图像的二值化可以根据下面的阈值来处理:假设一幅原始图像的像素值p(i,j)的取值范围为[0,m],那么设有其阈值为T=t,0

?1, if p(i,j)?T (式2.2) p'(i,j)???0, if p(i,j)?T对于基于灰度分布的二值化就是一个带阈值T的二值映射过程,其分割效果的关键在于阈值T的选取。有的应用可以由计算机自动选取,有的则需要人工干预,所以阈值T的选取视应用范围而有所不同。对于字符识别来说,只需要保留文字特

第 10 页 共 54 页

中北大学2009届毕业设计说明书

征的二值信息即可。目前,众多学者对此已经进行了比较详细的研究,并提出了许多阈值选取的算法,这些算法大体上可以划分为三类:整体阈值法,局部阈值法和动态阈值法。

1) 整体阈值法(又称全局阈值法)

仅由像素点(i,j)的灰度值p(i,j)确定阈值的方法称为整体阈值选择法。典型的阈值选取算法有直方图法,熵阈值法等等,一般地,如果图像灰度直方图呈现双峰,或者图像中背景灰度与目标灰度呈明显分离状,整体阈值法分割图像效果良好且速度快。

2) 局部阈值法

由像素(i,j)的灰度值p(i,j)和像素周围点的局部灰度特性确定阈值的方法称为局部阈值法。不同的阈值法源于N(i,j)的不同选择。对于书写质量差,干扰较严重的字符,采用整体阈值法二值化,效果不太理想,局部阈值法有可能得到较为满意的二值化结果。

3) 动态阈值法

当阈值选择不仅取决于该像素阈值及其周围各像素的灰度值,而且还和像素坐标位置相关时,称之为动态阈值法。这种方法可以处理低质量甚至单峰直方图图像。对文字图像而言,由于笔画和背景的区分比较明显,并且动态阈值法的实现较为复杂、计算时间相对长,因此在文字识别中很少采用。

下图2.4所示是分别采用基于直方图的自动阈值分割结果和基于OTSU的二维最大类间方差阈值分割的改进算法[16]进行分割的结果。

对于以上三种二值化算法中,由于动态阈值法实现较为复杂而且用时较长,很难满足文字识别中的实时性要求,因此该算法在字符识别系统中很少被采用。由图2.4可见针对目标灰度和背景灰度具有较大的差距时,采用整体阈值法和局部阈值法能很好的将背景和目标进行分割,但是如果目标灰度和背景灰度差距较小或者光照不均匀的数字图像,如果采用上述两种算法都很难达到较好的效果。由图2.9可以看出,对于光照不均的图像,采用基于直方图的自动阈值分割和基于OTSU的二维最大类间方差阈值分割的改进算法分割得到的二值图像都不好。

鉴于在实际中,由于数字图像的获取阶段由于纸张不平整、反射光不均匀、光 照不均匀所导致而得到的数字图像其目标图像和背景图像灰度整体没有一个明显

第 11 页 共 54 页

  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

中北大学2009届毕业设计说明书 2 手写体数字识别中预处理技术 预处理对于一个良好的识别系统不仅是一个必不可少的环节,而且是至关重要的。如果预处理处理得不够理想,会从很大程度上降低整个系统的识别率。一般手写体数字识别而言,预处理包括很多部分,如平滑、去噪、二值化、归一化、细化、形状校正、去各种类印章、背景底纹等等。由于本文主要不是针对类似于票据识别中的这种具有各种背景底色或者印章之类的数字识别,本文主要研究的是在纸(无底纹、印章等)上写的手写体数字进行识别。因此本文就省去了去除类印章、背景底纹等的这些操作。 2.1 平滑去噪 数字图像的噪声主要来源于图像的获取(数字化过程)。图像传感器的工作情况受各种因素的影响,如图像获取中的环境条件和传感元器件自身的质量。例如,使用CCD摄像机获取的图像,光照强度和传感器温度是造成图像中产生大量噪声的

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com