搜索详情-找开题

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回

基于马尔可夫网络的字符识别开题报告

 2021-08-08 03:20:05  

全文总字数:1909字

1. 研究目的与意义

我们生活在一个不确定的世界里,未来任何事情我们几乎都无法百分之百的预测,而概率为我们对世界的不同事情或状态建立了可信度这一模型,而可信度是随着世界变化不停改变的。

虽然概率论从17世纪就开始出现,但也是在最近被用于解决涉及多变量交互的复杂问题,并导致了概率图模型的出现。概率图模型的框架包括了多种模型如贝叶斯网络和马尔可夫随机场。它们被广泛应用于网络搜索、医疗诊断、图像理解、语音识别、自然语言处理和机器人导航等。在这些应用中,概率图模型能使我们通过已有的带有干扰的数据来进行推断。

字已有数千年的历史,也是世界上使用人数最多的文字,对于世界灿烂文化的形成和发展有着不可磨灭的功勋,并将继续发挥重要的、其它文字形式难以取代的作用。然而,在当今高度信息化的社会里,如何快速高效地将字符输入计算机,已成为影响人机接口效率的一个重要瓶颈,也关系到计算机能否真正在得到普及应用。围绕这一问题,人们提出了各种解决方案。目前,字符输入主要分为人工键盘输入和机器自动识别输入两种。人工键盘输入是指用手工击键方式按照一定的规律把汉字输入到计算机,目前已有数百种键入方案。但是,与拼音文字的打字机不同,人们需要经过一定时间的学习训练才能掌握某种键入方法,更为严重的是:对于大量已有的文档资料,采用人工键入方法将要花费大量的人力和时间。为此,机器自动识别输入就成为了必须研究的课题。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 国内外研究现状分析

目前,手写体字符识别领域在所包括的特征提取、识别器、合成器等方方面面已经形成了两大类识别方法;基于结构特征的方法和基于统计特征的方法,利用机器识别文字符号,可以说从1929年陶舍克利用光学模板匹配识别开始。当时,他使用了10块模板对应10个数字,依次把待识别的数字投影到这10块模板上,当模板透过的光达到最小时(数字遮挡了模板的透光部分),数字就被识别成这块模板上的数字。大约在50年代末60年代初,就已经出现了关于利用计算机识别数字及英文符号的研究论文。随后,日本对汉字识别进行了研究。大约从70年代开始,相继对印刷体汉字识别、手写印刷体汉字识别及在线手写汉字识别进行了研究。1980年进行了印刷体汉字识别的公开表演,1981年5月在日本第56届商业展览会上,富士通研究实验室进行了手写印刷体汉字识别的公开表演。1984年日本研制成多体印刷汉字识别装置,识别率为99.98%,识别速度大于100字/秒,代表了印刷体汉字识别的最好水平。最近几年出现的手写印刷体汉字识别装置,识别率可以达90%,识别速度5~40字/秒,笔顺可变,笔划数不变的联机手写楷书汉字识别装置已有产品出售,正在研究具有一定规则的手写行书识别装置。我国的汉字识别研究比日本晚了大约10年,1988年后才有初步实用的印刷体识别系统问世。

从目前的文字识别技术水平来看,与实际的需求之间的确存在很大距离,可以说,在文字识别领域需要发现一些关键的计算方法,至少现在还没有完全掌握这些方法,另一方面,文字识别必须充分地运用人识字的知识,即字→词→句的理解,从这个角度来说,文字识别技术正期待着人工智能在自然语言理解方面的进步。

3. 研究的基本内容与计划

课题的任务是在给定的图像中,利用马尔可夫模型识别出手写体的文字,该模是双向传递的图模型。利用各种图像处理技术,主要用于识别算法前的初步处理;初步图像识别理论,进行算法比较简单的汉字识别;matlab算法仿真验证。

计划:

3月1号~3月20号完成开题报告。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究创新点

通过研究足够大的样本,建立马尔可夫网络概率图模型,可以使系统的识别率不断上升,提高手写字符识别的准确率。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。