帮帮文库

返回

脱机汉字识别的研究 脱机汉字识别的研究

格式:word 上传:2022-06-24 20:56:20

《脱机汉字识别的研究》修改意见稿

1、“..... 用样本方差能量度这种差异的大小各个样本的特征的值接近,表现为样本方差 小各个样本的特征的值差异大,表现为样本方差大。特征般为矢量,标量看 成是维矢量。个维矢量,„的样本方差为  其中为样本均值  用每类别中的所有样本特征的平均值作此类别的特征,类就有个矢量, 用这个矢量计算的样本方差就是类间方差,此值越大表明不同类别之间的特 征的值差异越大。在每类别中计算这类别所有样本的特征的方差,就是类内方 差,类就有个方差,求它们的平均值,就是类内方差均值,此值越小表明 同类别内样本的特征的值越接近。定义类间类内方差比简称方差比为类间方 差除以类内方差均值,此值越大,表明这种特征越好。就以这个方差比作为特征 优劣量度标准。设总共有个类别,每个类别有个样本,是第类的第 个样本......”

2、“.....在求样本方差的时候需计算两个矢量的距离的平方,而这个距离的平方是 与矢量的维数有关的,是每维距离的平方的和,维数越多,求和项越多,也就 是说维数越多,方差的值趋于越大,因此,这种方法只适应于比较两种维数相同 的特征的优劣。对于维数不同的特征,仍然需要通过整个识别过程得到的正确识 别率来比较,这时两种特征下的分类器因为特征的维数不同结构会显著不同了, 这样得到的结果严格来说是特征加上此特征下的分类器共同作用下的结果。 方差比是般的特征优劣量度方法,不仅适用于汉字特征的比较,只要两种 特征的维数相同。 噪声去除 手写的汉字会因墨与纸的关系而出现毛刺,也就是笔画边缘凹凸不平,而且 笔画内部也会有空洞......”

3、“.....会影响特征的提取, 进而影响对其识别。对噪声的去除是很重要的预处理过程。 中值滤波器具有能有效去除数字图像的噪声而又不会使图像中物体边界模 糊的特点。它的般算法为 遍历图像的每个像素,将它和与它相邻的八个像素的灰度排序,取排在中 间的像素的灰度值作输出图像的这个像素的灰度。 将其用 模板分类器 神经网络网络分类器及改进 神经网络网络分类器 隐马尔可夫过程分类器 总结 参考文献 毕业论文设计任务书 毕业论文设计考核表 脱机汉字识别的研究 郑志洵 导师杨建刚 浙江大学计算机科学与技术系 摘要本文提出了种于分类器的特征优劣量度标准类间类内方差比, 用其比较了用不同方法提取出的汉字特征的优劣,并改进了预处理和特征提取的 方法,取得了更好的效果。对各种分类器用于汉字特征的分类识别做了实验比较......”

4、“.....使其对类似汉字识别的超多类别分类有较好 的效果。最后得到了套可行的脱机汉字识别方案。 关键词脱机汉字识别特征提取分类器 , 整套可行的汉字识别方案。本文没有涉及汉字行字切割 和基于语法的后处理。本文处理的是二值化后的单字的图像,代表白像素, 代表黑像素。 新的特征优劣量度标准 在探讨汉字特征之前,先对特征优劣量度标准作分析。如何评价两种特征 提取方案的优劣般的方法是设计个分类器,用从训练样本提取出来的种 特征训练分类器,然后用从测试样本提取出来的这种特征测试,可以获得正确识 别率。正确识别率高的特征优秀。这个方法依赖整个识别过程,分类器的结构对 其影响很大,有可能出现用不同分类器得到的好的方案不致。特征的优劣应该 是不依赖于分类器的。因此,我提出了个新的特征优劣量度标准,这是不依赖 于分类器的特征优劣量度标准......”

5、“.....考虑何谓优秀的特征。同类别的 样本提取出的特征的值尽可能接近,不同类别的样本提取出的特征的值尽可能有 大的差异,这样的特征就能很好地表示出类别间的差异类别内的共性,这就是 好的特征。反之,若同类别的样本提取出来的特征的值有很大差异,而不同类别 的样本提取出的特征的值差异却不大,那这样的特征就不能很好地区分类别了。 用样本方差能量度这种差异的大小各个样本的特征的值接近,表现为样本方差 小各个样本的特征的值差异大,表现为样本方差大。特征般为矢量,标量看 成是维矢量。个维矢量,„的样本方差为  其中为样本均值  用每类别中的所有样本特征的平均值作此类别的特征,类就有个矢量, 用这个矢量计算的样本方差就是类间方差,此值越大表明不同类别之间的特 征的值差异越大。在每类别中计算这类别所有样本的特征的方差,就是类内方 差,类就有个方差......”

6、“.....就是类内方差均值,此值越小表明 同类别内样本的特征的值越接近。定义类间类内方差比简称方差比为类间方 差除以类内方差均值,此值越大,表明这种特征越好。就以这个方差比作为特征 优劣量度标准。设总共有个类别,每个类别有个样本,是第类的第 个样本,是第类的样本均值  是所有类样本均值的平均值  方差比的数学表达率。正确识别率高的特征优秀。这个方法依赖整个识别过程,分类器的结构对 其影响很大,有可能出现用不同分类器得到的好的方案不致。特征的优劣应该 是不依赖于分类器的。因此,我提出了个新的特征优劣量度标准,这是不依赖 于分类器的特征优劣量度标准。 为获得于分类器的特征优劣量度方法,考虑何谓优秀的特征。同类别的 样本提取出的特征的值尽可能接近,不同类别的样本提取出的特征的值尽可能有 大的差异,这样的特征就能很好地表示出类别间的差异类别内的共性......”

7、“.....反之,若同类别的样本提取出来的特征的值有很大差异,而不同类别 的样本提取出的特征的值差异却不大,那这样的特征就不能很好地区分类别了。 用样本方差能量度这种差异的大小各个样本的特征的值接近,表现为样本方差 小各个样本的特征的值差异大,表现为样本方差大。特征般为矢量,标量看 成是维矢量。个维矢量,„的样本方差为  其中为样本均值  用每类别中的所有样本特征的平均值作此类别的特征,类就有个矢量, 用这个矢量计算的样本方差就是类间方差,此值越大表明不同类别之间的特 征的值差异越大。在每类别中计算这类别所有样本的特征的方差,就是类内方 差,类就有个方差,求它们的平均值,就是类内方差均值,此值越小表明 同类别内样本的特征的值越接近。定义类间类内方差比简称方差比为类间方 差除以类内方差均值,此值越大,表明这种特征越好......”

8、“.....设总共有个类别,每个类别有个样本,是第类的第 个样本,是第类的样本均值  是所有类样本均值的平均值  方差比的数学表达式如下         注意,在求样本方差的时候需计算两个矢量的距离的平方,而这个距离的平方是 与矢量的维数有关的,是每维距离的平方的和,维数越多,求和项越多,也就 是说维数越多,方差的值趋于越大, 隐马尔可夫过程分类器 总结 参考文献 毕业论文设计任务书 毕业论文设计考核表 脱机汉字识别的研究 郑志洵 导师杨建刚 浙江大学计算机科学与技术系 摘要本文提出了种于分类器的特征优劣量度标准类间类内方差比, 用其比较了用不同方法提取出的汉字特征的优劣,并改进了预处理和特征提取的 方法......”

9、“.....对各种分类器用于汉字特征的分类识别做了实验比较, 改进了神经网络分类器的结构,使其对类似汉字识别的超多类别分类有较好 的效果。最后得到了套可行的脱机汉字识别方案。 关键词脱机汉字识别特征提取分类器 , 整套可行的汉字识别方案。本文没有涉及汉字行字切割 和基于语法的后处理。本文处理的是二值化后的单字的图像,代表白像素, 代表黑像素。 新的特征优劣量度标准 在探讨汉字特征之前,先对特征优劣量度标准作分析。如何评价两种特征 提取方案的优劣般的方法是设计个分类器,用从训练样本提取出来的种 特征训练分类器,然后用从测试样本提取出来的这种特征测试,可以获得正确识 别率。正确识别率高的特征优秀。这个方法依赖整个识别过程,分类器的结构对 其影响很大,有可能出现用不同分类器得到的好的方案不致。特征的优劣应该 是不依赖于分类器的。因此......”

下一篇
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
脱机汉字识别的研究.doc预览图(1)
1 页 / 共 58
脱机汉字识别的研究.doc预览图(2)
2 页 / 共 58
脱机汉字识别的研究.doc预览图(3)
3 页 / 共 58
脱机汉字识别的研究.doc预览图(4)
4 页 / 共 58
脱机汉字识别的研究.doc预览图(5)
5 页 / 共 58
脱机汉字识别的研究.doc预览图(6)
6 页 / 共 58
脱机汉字识别的研究.doc预览图(7)
7 页 / 共 58
脱机汉字识别的研究.doc预览图(8)
8 页 / 共 58
脱机汉字识别的研究.doc预览图(9)
9 页 / 共 58
脱机汉字识别的研究.doc预览图(10)
10 页 / 共 58
脱机汉字识别的研究.doc预览图(11)
11 页 / 共 58
脱机汉字识别的研究.doc预览图(12)
12 页 / 共 58
脱机汉字识别的研究.doc预览图(13)
13 页 / 共 58
脱机汉字识别的研究.doc预览图(14)
14 页 / 共 58
脱机汉字识别的研究.doc预览图(15)
15 页 / 共 58
预览结束,还剩 43 页未读
阅读全文需用电脑访问
温馨提示 电脑下载 投诉举报

1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。

2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。

3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。

  • Hi,我是你的文档小助手!
    你可以按格式查找相似内容哟
DOC PPT RAR 精品 全部
小贴士:
  • 🔯 当前文档为word文档,建议你点击DOC查看当前文档的相似文档。
  • ⭐ 查询的内容是以当前文档的标题进行精准匹配找到的结果,如果你对结果不满意,可以在顶部的搜索输入框输入关健词进行。
帮帮文库
换一批

搜索

客服

足迹

下载文档