“近几年,手写识别达到了更高的性能水平。但是,所有的性能值都是基于不同的测试数据集得到的。”
对不同算法研究的试验结果进行比较,这个任务如果不是不可能的也是非常困难的。这是由于存在许多不可控的因素,例如不同的设备、程序、数据、输入人、评估方法等, 其中一些变化文献的作者并没有进行充分的描述。
本文献描述了使用最小分类错误(MCE)准则去解决联机无约束手写字符和单词识别的问题。使用一个隐马尔科夫模型的字符和单词的MCE训练器,最小化字符和单词的识别错误率。数据的收集是IBMInkManagerSoftware开发项目的一部分。总共个字符类别包括 106,396 样本,由 174 个不同的人书写,包括连续书写风格、离散书写风格和强制风格。和最大拟然系统相比有,30%的字符错误率降低。
本文提出了一种使用写者适应技术来改进联机手写识别的识别率的方法。当识别错误产生时,在用户输入的字符的基础上使用人工生成的样本训练一个两类分类器。
以此提高手写系统对特定写者的手写识别的识别率。IBM 沃森研究中心笔计算组收集的联机手写数据库的一部分。总共 3 个数据集:数字 12,291,小写 80,524,大写。由100个不同的人员输入。每个数据集被随机的分为大小相等的2个部分,一半用于训练,一半用于评估。比较不同参数下分类错误的情况。
描述一个基于判别的框架,使用这个框架来识别联机手写数据。标识出子笔画。把笔画分为子笔划,比较每个子笔划的 “区分潜力”,也就是那几个子笔划的区分能力更强。数据集包含超过1,200个联机手写数字和字符,这些字符由不同的人员使用的CrossPad设备输入。数据被分为训练集和测试集。分别使用不加权的方法和加权的方法,比较字符对的区分效果。直接引用商业产品和以前文献中提到的识别性能,比较分析原因。
本文介绍了一种联机手写蒙古语单词的识别方法。使用一个递归神经网络,提高无约束书写的蒙古语单词的识别率。使用自己制作的蒙古语单词数据集。包含个单词,从中选择了4,000个作为测试集。分别比较,本文的方法(不使用语言模型)、本文的方法(使用语言模型)、HMM(使用语言模型)、3中方法的性能。
本文介绍了一种使用线性差值识别泰文字符的方法。用户书写80个不同的泰文字符,每个字符输入3次。输入的字符作为1、缺省的库;2、个人库,分别用于训练。比较训练得到的泰文字符的识别率。本文直接引用其他 2 篇文献给出的识别率,和本文方法的识别率进行比较。
本文描述了一种使用时空模型进行联机手写中文字符识别的方法。使用统计结构模型从概率方面描述中文字符的结构特征。使用一个改进的隐马尔科夫模型捕获时空信息。两个模型的紧密结合产生一个强有力的时空统一模型。通过识别率比较,证明这个模型与传统的HMM和属性关系图相比有更好的性能。数据集支持3,755个不同的汉字字符,每个字符有100个样本用于训练。7个不同的集合被用于评估,每个集合包含3,755个字符。书写风从楷书到草书都有。按照以前的文献实现的算法、作者以前研究的算法、本文的方法,比较识别率。
本文介绍了一种基于多边形近似的“段抽取”算法用于联机中文手写识别。一个笔画被一个有最小内角的点分割为2条曲线,这个点叫做“切点”或“拐点”。对切分得到的 2 条曲线使用同样的方法寻找拐点。递归执行这个过程,直到内角值大于某个阈值。所有找到的“拐点”和端点组成笔画,相邻的点组成“段”。这个方法有较少的计算复杂度(抽取的段的数量比较少)和更好的近似效果。本文没有说明测试数据集的信息(来源、大小、分布等)。比较使用所提出的方法前后,识别率和识别速度的变化。
以三菱公司开发了一个“日文的AMITY”联机手写识别系统为基础开发了一个“中文的AMITY”联机手写识别系统。由于不同的笔画数,笔画顺序和形状等原因,原有日文识别系统识别汉字性能比较差。作者改进了原有的系统来提升联机手写中文识别的识别率。由400人书写的3942类基本汉字(常用汉字),以及由50人书写的类扩展的汉字(2,821类剩余的简体汉字和1,300类繁体汉字)一半的数据用于训练,一半的数据用于评估。比较使用不同数据集训练和算法修改后的识别率。
本文从一个最大拟然训练 HMM 模型出发,专注于字根最小识别错误来优化识别性能。提出了一种新的最小字根误差判别训练准则。使用平板电脑收集手写数据。总共3,755个类别的字符。训练集包括562,250个样本,每个字符150个样本。测试集包括56,325个样本,每个字符15个样本。包含3种书写风格(规整、连笔、草书)。
使用不同的方法训练,比较性能差别。
介绍了一种使用汉字和拼音相结合的方法手写输入字符的系统。这个系统中使用了多个分类器集成的方法来保证稳定性和鲁棒性。数据集包含 7,663 个中文字符,个拼音符号。每个中文字符500个样本(400训练,100评估。)。每个拼音200个样本100个训练,100个评估。针对数据集给出识别率。
本文描述了使用8方向特征进行联机手写汉字识别的方法。使用自己收集的数据集。
个写者。3,755个GB2312-80一级汉字,每个人输入每个汉字一次。200个用于训练,100个用于评估。比较相同分类器下,不同特征的识别率。
本文介绍了一种基于字根的联机手写中文字符识别方法。包含 3 个创新点,分别是统计分类字根、字符中字根候补的过切分,以及词典驱动的字符识别。使用的数据集包括 4,284 个“左右结构”的汉字,每个类 60 个样本,由 60 个人独立书写。
个样本用于训练,10 个用于评估。和一个整体字符识别方法、以及省略部分步骤后的方法比较识别率。
职称评定要求要发表论文,论文发表要注意哪些事情。有哪些期刊可以选择,欢迎在本站查阅可以在本站了解一下评职的具体要求哦,也可以咨询我们。