云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > 手写体数字识别的软件设计(毕业设计论文)

手写体数字识别的软件设计(毕业设计论文)

  • 62 次阅读
  • 3 次下载
  • 2025/4/30 15:57:01

中北大学2009届毕业设计说明书

的选择和提取,却没有可遵循的理论来指导,我们很难比较一个物体中哪些特征是实质性,哪些特征是代表性的,哪些特征可能是不重要或与识别无关紧要的,这些都需要大量的实验和理论指导。经过人们在这方面的大量研究工作,提出了一些统计特征提取方法。

由此可见,对手写体数字图像进行特征值的提取,特征值的选择不仅能浓缩信息、降低维数、提高处理效率的同时,其对系统的识别性能也有很重要的影响。在4.3和4.4小节中,我们将详细描述本文所采用的8种特征值(3个结构特征、5个统计特征,共120个特征向量)的提取方法。 4.3 手写体数字识别中的结构特征提取

采用结构特征对字符进行结构分析以达到识别目的是一种非常直观的方法。字符由各个子部件构成,逐级分析字符图像的结构,根据元素的属性、数量及其相互关系,便可判定待识字符。

与统计方法相比,结构分析不注重特征的绝对位置,只考虑特征的相对关系,因而对书写风格的变化不敏感,其缺点在于特征提取的算法都相对复杂。下面将介绍本文采用的3种结构特征向量的提取方法。 4.3.1 结构点特征

目前,在手写体字符识别的特征提取中,结构点特征占了很重要的一部分。结构点特征是指字符笔划中的端点、交点及拐点,交叉点是多个笔划相交的交点,交点又有三叉点和四叉点之分。拐点是笔划书写方向上有显著变化的点。对结构点特征的检测方法有多种,比较传统检测端点、三叉点与四叉点的方法如下:

假设当前点位p,则其八个邻域的点位置如下所示:

??????x x x?? x p x?x x x???43251678令:

d??xi (式4.1)

i?18判别条件如下:

如果d=1,则p为端点。

第 32 页 共 54 页

中北大学2009届毕业设计说明书

如果d=3,则p为三叉点。 如果d=4,则p为四叉点。

然而上述方法对某些三叉点和四叉点的检测并不是很准确,如图4.1所示中的灰色像素,该像素连接着上、下、左三个方向的“骨架”,如果去除该像素的话,原细化图像将产生断开现象,因此该像素点是不可缺少的。但根据式4.1进行检测判断,那么该点像素为三叉点,并且该像素的左边的一个像素为四叉点。然而从直观上看,该灰色像素的三叉点应该不能计算在内(否则的话字符图像8就多了一个三叉点),应该属于“重复”检测。

细化图像 图4.1 数字8

因此,本文提出对4.1的一种改进方法,该方法详细步骤如下:

Step1:根据式4.1对原始细化图像进行点检测,并将每个像素点是否为端

点、三叉点、四叉点并标记到对应的新位图中。

Step2:从上到下从左到右依次扫描,如果该点不是三叉点的话,不做任何

处理,否则的话,则检测该像素点邻域的8个点中是否有四叉点,如果有四叉点,则该点标记为非特殊点。

Step3:统计端点、三叉点、四叉点的个数。

上面叙述的是一个通俗易懂的方法,其可以做进一步优化。采用本文的改进算法之后,对类似于这种特殊的三叉点不会再被检测为特殊点,有效的提高该特征向量的准确性。

而对于拐点,文献[20]提出了一种确定拐点的方法,就图像骨架取相邻7点,以中心为考察点,分别用反正切公式计算前四点和后四点的近似直线的角度,考察这两个直线的夹角θ是否大于所设定的阈值T来判定中间点是否为拐点。作者提出的角度公式如下:

??n?0?tan?1??2y(n?1)?y(n)????x(n?1)?x(n)? (式4.2) 3?第 33 页 共 54 页

中北大学2009届毕业设计说明书

其中,x(n)和y(n)分别表示第n个像素的坐标值。

但是,由于上述方法在阈值的选择上需要依靠经验设定,对于不同大小规范化的样本,都需要重新确定一次阈值。因此本文采用文献[8]提出的一种简单的检测拐点的方法。该方法的基本思想是:先按一定顺序扫描细化图像中的每一个点,若某点的链码方向从水平(垂直)方向变换为垂直(水平)方向,则认为该点位拐点。扫描顺序和链码方向如图4.2所示。

???????3 2 1?x x x???? ?4 p 0? x p x????x x x??5 6 7????43251678 图4.2 左边为像素扫描顺

序,右边为链码方向编码

图4.3给出了本文采用的特殊点检测算法检测数字8上的端点、拐点和交叉点的示意图。

4.3.2 穿越密度特征

穿越密度(次数)特征已被广泛的应用于字符识别的研究中。穿线法是取得笔划密度的一个通用算法,其基本思想是用一组或几组与水平成0度、30度、45度或者60度等的平行线,贯穿字符,提取字符与平行线的交点信息作为识别的依据。

第 34 页 共 54 页

图4.3 数字8细化图像上检测到

的特殊点的示意图

中北大学2009届毕业设计说明书

该算法由于涉及字符拓扑结构方面的信息,所以对字符旋转缩放和变形有较强的容忍度。文献[21]提出的一种径向贯穿字符的穿线法,该方法以字符重心为坐标原点,分别从坐标原点以0、45、90、135、180、-135、-90、-45度方向引出8条线穿越字符,以各个方向穿越字符的次数组成向量作为该字符的径向笔划密度特征。但是,当书写风格引起统一字符的之心位置不同时,该方法提取的特征准确性差。

本文采用的是整体贯穿法,该方法就是间隔一定距离从垂直和水平方向上进行整体穿越,由于本文通过归一化处理后的图像的大小是20×20的,因此本文采用方法是间隔5个像素进行从水平和垂直方向进行穿越,从而得到4行、4列上(共8个)的穿越次数统计,将之作为特征向量。 4.3.3 投影特征

如图4.4所示,将一个字符点阵划分为四个象限区域,共有十二个边线。将一个字符点阵中的每一个黑点向最近的四条边线沿水平和垂直方向进行投影,用十二 条边线上的投影长度作为投影特征,一共有十二个特征。

图4.4 投影特征示意图

之所以选用投影特征作为手写体数字识别的特征,主要是因为投影特征计算简单,能够反应字符的内部结构和笔划的分布情况,唯一性好,可区别性好,是比较有代表性的特征,不同数字之间的12个投影特征的各个分量差异比较明显,可以考虑作为分类的细特征。

第 35 页 共 54 页

  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

中北大学2009届毕业设计说明书 的选择和提取,却没有可遵循的理论来指导,我们很难比较一个物体中哪些特征是实质性,哪些特征是代表性的,哪些特征可能是不重要或与识别无关紧要的,这些都需要大量的实验和理论指导。经过人们在这方面的大量研究工作,提出了一些统计特征提取方法。 由此可见,对手写体数字图像进行特征值的提取,特征值的选择不仅能浓缩信息、降低维数、提高处理效率的同时,其对系统的识别性能也有很重要的影响。在4.3和4.4小节中,我们将详细描述本文所采用的8种特征值(3个结构特征、5个统计特征,共120个特征向量)的提取方法。 4.3 手写体数字识别中的结构特征提取 采用结构特征对字符进行结构分析以达到识别目的是一种非常直观的方法。字符由各个子部件构成,逐级分析字符图像的结构,根据元素的属性、数量及其相互关系,便可判定待识字符。

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com