设文无忧为首页 | 把文无忧加入收藏夹 | 站务联系     论文格式网:论文格文下载,论文格式大全,论文格式范例,如何写论文,怎么把握论文的格式,分类最全的论文范文格式网。
你所在的位置:首页 > 论文大全 > 计算机论文 > 软件类论文
软件类论文:联机手写识别软件单字识别率评估工具的设计与实现
联机手写识别软件单字识别率评估工具的设计与实现
| 文章出自:论文格式网 | 编辑:论文范文 | 点击: | 2012-08-02 14:01:41 |

  联机手写识别技术(online handwriting recognition, OHWR)的识别过程是和手写输入过程同时进行的。
  目前市场上存在很多联机手写识别软件,哪个联机手写识别产品的识别率高是很多人关心的问题。大多数联机手写识别软件的开发厂商提供了识别率的参考值。但是,由于不同的产品使用不同的评测集进行评估,不同厂商开发的产品很难进行性能的比较。由于不知道其他厂商手写引擎的API接口,在拥有手写数据的情况下,也没有办法评估其他的联机手写识别软件的识别率。这对于希望购买和使用合适的联机手写识别软件的个人用户和公司来说,产生了很大的困扰。
  针对目前不同的联机手写识别软件的识别率评估和性能比较存在的困难和问题,设计和实现了一个基于PC机Windows平台的不同联机手写识别软件的单字识别率评估工具,并使用这个工具对PC机Windows平台上常见的几种联机手写中文识别软件的单字识别率进行评估。
  人们从20世纪50年代后期开始研究联机手写识别技术。随着移动设备的普及和发展,联机手写识别重新引起了广泛的关注。因为手写输入更加符合人们的输入习惯,它的便利性是其他字符输入方法无法比拟的。
  文献详细介绍了90年代以前所运用的手写相关的技术,包括联机手写、脱机手写、签名验证等内容。文献总结了2000年以前的联机手写技术,主要关注于英文字符的联机手写识别问题。而文献整理了2004年以前重要的联机手写中文字符识别的主要技术。
  联机手写识别是边输入、边识别的过程,对应实时和动态的特性。由于能够同时使用空间和时间的信息,联机手写的识别率通常比脱机手写识别的识别率要高很多。
  接下来,我们对联机手写识别的通用步骤进行一个简要的介绍。联机手写识别算法的步骤主要包括预处理部分、轨迹分割部分、特征抽取部分、识别(分类)部分以及识别后处理等。预处理部分包括降噪、数据平滑过滤、数据缩减、轨迹正规化等不同的方法。主要目的是为了减少同一类别的不同样本字符之间的差异。分割的目的是得到识别过程中需要处理的各种基本单元,例如词、字符、笔画等。特征抽取步骤的目的是使用特征集合(或者叫做特征向量)在一个多维空间中描述字符的形状,或者使用基于结构和规则的方法描述字符的形状[4]。识别(分类)部分是应用统计分类方法或者基于结构和规则的分类方法把输入的字符轨迹的特征和识别字典中的每个类别的特征进行比较,找到最相似的类别作为输入轨迹的识别结果。和其他大类别的识别分类问题相似,联机手写中文字符识别通常采用两级分类的策略。粗分类从所有类别中选出一个包含正确候补类别的子集。在选出的子集合中,通过细分类选出最优的结果。粗分类通常采用小计算量的分类方法,以此加快分类速度,例如聚类、简单特征匹配后的快速选择。细分类多使用传统的统计分类方法或者结构匹配的方法进行字符的识别,以此得到准确的字符识别结果。后处理部分使用语言模型(单字频、双字频、n-gram 方法、词匹配、拼写检查等技术)、位置特征、几何特征来验证和改进识别结果。
  后处理方法通常用于单词或者句子的手写输入识别,对于联机手写单字识别帮助不大。
  从联机手写识别的发展来看,不论英文字符识别还是汉字的识别,都是从单个字符的书写向单词、句子的识别发展。书写风格从规整的书写向人们日常书写风格转变。书写风格的转变要解决的主要问题是笔画顺序、笔画数量、笔画形状的剧烈变化对字符分类的影响,找到应对这些变化的前处理方法(主要是正规化)、特征抽取方法、识别方法,以及在不同方法之间进行组合、集成,例如结构特征和统计特征结合、多种不同分类器集成等。
  目前,联机手写识别软件的识别率信息只能来源于开发企业的产品说明。但是,由于不同开发企业使用了非公开的不同的评估数据,不同联机手写识别产品之间的性能没有办法进行比较。由于不知道联机手写识别产品的识别引擎的信息,没有办法直接把手写轨迹传入识别引擎,因此就算使用相同的联机手写数据集也没有办法评估不同的联机手写识别软件的识别率。在联机手写识别软件的性能不明确的情况下,用户和企业没办法选择性价比最合适的联机手写识别产品。因此,开发一个联机手写识别软件的单字识别率的工具是有意义的。
  本论文是有关联机手写单字识别率评估工具的设计与实现的论文。本文详细描述了整个评估工具的开发背景、开发的意义、具体的实现步骤、并对 PC 机系统下常见的联机手写单字识别软件的性能进行了评估、比较。
  了公开的手写识别算法的识别率比较的方法。其次,介绍了没有公开算法的联机手写识别软件的识别率信息和识别率评估存在的主要问题。由此引出开发一种统一的联机手写识别软件的识别率评估工具的意义。
  详细介绍了目前国内外主要的公开联机手写数据库的信息,以及本论文中使用的联机手写数据集。
  描述了联机手写单字识别软件评估工具的设计与实现。介绍了这个工具的整体解决方案,说明这个评估工具支持的主要功能,针对功能中的技术难点进行解决步骤的设计,最后给出实现的方法,并在文中列举了一些关键的代码实现。
  以申请的公开联机手写数据集为评估数据,使用开发的评估工具对机 Windows 平台上常见的联机手写输入法进行单字识别率的评估,并对评估的结果进行比较。本章中同时描述了评估的软硬件环境。
  第6章是总结和展望,主要是对整个论文工作的总结,以及下一步需要研究、开发的重点和对将来工作的展望。
  对于单字识别问题,每一个输入的字符,分类器都会给出一个分类结果。所以,“识别出来的全部样本的个数”等于“标准样本的总样本个数”,召回率等于精度。因此,统一使用精度、识别率表示算法或产品的性能。(本文中认为分类器拒绝识别属于识别错误的一种情况。)在选择联机手写产品时,用户除了考虑识别精度这个指标之外,还需要了解手写产品的价格、识别速度、产品支持的软硬件环境,包括运行所需内存大小、占用的静态存储空间、支持的字符集、支持的硬件平台、软件平台等信息。
  在以上列出的要素中,除了识别精度和速度外,其他信息都可以从手写识别软件的开发企业得到确切的信息,并在不同产品间进行比较。

特别注意:本站部分信息由网络收集整理.如有错误,请联系我们修改,谢谢!

友荐云推荐
相关论文列表
文无忧论文格式网是一个专业提供各类论文的标准格式,标准论文格式范文,各类论文范文模板,免费论文下载,各类应用文文书、合同范文等的论文网站。
Copyright©2012-2046 文无忧. All Rights Reserved .心无界 文无忧—文无忧 让你行文无忧 版权所有 文无忧lun.wen5u.com-论文无忧
网站合法性备案号:蜀ICP备14013885号-1