【毕业设计】脱机汉字识别的研究

格式：word 上传：2022-06-24 20:07:38

《【毕业设计】脱机汉字识别的研究》修改意见稿

1、“.....会影响特征的提取，进而影响对其识别。对噪声的去除是很重要的预处理过程。中值滤波器具有能有效去除数字图像的噪声而又不会使图像中物体边界模糊的特点。它的般算法为遍历图像的每个像素，将它和与它相邻的八个像素的灰度排序，取排在中间的像素的灰度值作输出图像的这个像素的灰度。将其用于对汉字二值图像滤波，可以得到很简单的不需要排序的算法遍历图像的每个像素，计算它和与它相邻的八个像素中黑像素的个数，如果大于或等于，则输出图像的这个像素为黑像素，否则为白像素。这是因为对二值图像的九个像素排序后，排在中间的像素为黑像素当且仅当九个像素中黑像素的总数大于或等于。此算法的复杂度为，为图像的像素总数。每个单字的图像像素若固定，例如，则固定，此算法复杂度为常数。图是手写汉字的图像，每个字大小是像素。图二是用上述中值滤波器对其滤波的结果。可以看到，滤波后汉字的边缘光滑多了，些多余的噪声点也去除了。图三是没有滤波就直接细化的结果......”。

2、“.....可以看到不滤波就直接细化的汉字骨架上有不少多余的短笔画，这是由于原汉字的毛刺造成的，这些多余的毛刺或者笔画中的空洞在细化后就会形成多余的短笔画，而滤波后再细化的汉字骨架就少了这样的毛刺笔画。中值滤波确能很好地去除汉字图像的噪音，包括笔画边缘的毛刺，复杂度又极低，因此中值滤波器可以作为汉字图像噪声去除的好算法。下面的实验使用的汉字图像都是经过中值滤波处理后的图像。图手写汉字图像图二中值滤波后的图像图三未滤波直接细化的结果图四中值滤波后细化的结果归化预处理归化预处理的目的是减少不同人写的字的差异，使不同风格的同个汉字能提取出相近的特征。不同的特征提取方法需要的归化预处理是不同的，下面先将不同的归化预处理方法给出，第部分汉字特征提取将比较这些归化预处理在不同的特征提取方法中使用的效果。细化细化的目的是为减少笔画粗细对汉字特征的影响。不同人写的同个字提取出的特征应该尽可能相同，但不同人写的字粗细不同......”。

3、“.....这些不同会影响提取出的特征。细化的思路是反复遍历图像，删除处在边界上的满足条件的黑像素，直到得到保持原物体拓扑结构的单像素宽的线。细化的关键在于寻找可以删除的黑像素处在边界上且删除后不会改变物体拓扑结构的黑像素可以删除。我通过分析，找到了如下的条件图五相邻像素的字母代号如上图，为待处理的像素，其余八个像素是与相邻的像素，它们的代号见图中的字母。如果为，则其不是黑像素，不用处理。如果为，有个是，则是边界点，考虑其能否被删除。又因为地位相同，这里只讨论为的情况。如果与相邻的八个像素至多有个黑像素，则是线段的端点，不能删除如果也为，同时左边那列至少有个像素为，右面那列至少有个像素为，此时若删除，将破坏黑像素的连通性，因此不能删如果为，左边右边两列中有列全为，另列至多有两个，那么或者是端点或者删除会破坏黑像素连通性，不能删除如果为，和为，或为，则删除会破坏黑像素连通性，不能删除如果和为，那么或者是被包围的像素......”。

4、“.....不能删除如果和为，那么或者是被包围的像素，或者删除后会破坏黑像素的连通性，不能删除否则可删除。这是为的情况，对于为的情况，只需将其旋转就可得到删除条件。细化算法如下做如下循环从图像开始遍历每个像素，若为，为，根据上面所述条件判断其是否应被删除，若应该删除，将其标记，遍历完后在原图像中将标记应被删除的改为从图像开始遍历每个像素，若为，为，根据类似上面所述条件判断其是否应被删除，若应该删除，将其标记，遍历完后在原图像中将标记应被删除的改为从图像开始遍历每个像素，若为，为，根据类似上面所述条件判断其是否应被删除，若应该删除，将其标记，遍历完后在原图像中将标记应被删除的改为从图像开始遍历每个像素，若为，为，根据类似上面所述条件判断其是否应被删除，若应该删除，将其标记，遍历完后在原图像中将标记应被删除的改为直到没有黑像素被删除为止，退出循环。每个循环都对图像做四次遍历......”。

5、“.....所以我分四次遍历，每次删除个方向的边界。这个算法的复杂度为，是图像像素总数，对汉字图像，其固定，如，是汉字笔画的最大宽度的半，因此此算法复杂度是随汉字笔画宽度增加而线形增大的。用此算法细化汉字的结果见图三图四。提取轮廓提取轮廓也可以看成是种细化方法，但其结果是使汉字的每个笔画成为两条边界线而不是细化后的条线。提取轮廓算法比细化简单，当黑像素周围八个像素都是黑像素时把它删除，则留下来的就是汉字轮廓。这是因为黑像素处于轮廓位置当且仅当与其相邻的八个像素不全为黑像素。算法如下遍历图像的每个像素，若其为黑像素，则计算与其相邻的黑像素总数，如果为八，则将其标记，遍历完后将标记了的像可分的分类神经网络能更好的适应训练集，并且通过与理想输出距离比较来选择正确的网络的方法对训练集是有效的。然而，对未经训练过的测试集样本的识别率就低很多，而且和模板分类器相反，维数越高的特征识别率越小......”。

6、“.....比较待分类矢量与各类模板的欧式距离来确定其所属类别的。不同于节用求平均的方法建立模板，网络建立模板的训练算法如下设为训练速率，为循环上限，为类别总数，为第类的模板矢量初始化模板用训练集的套样本做模板初始值循环次数为。作如下循环对训练集中的每个样本，求出与其距离最近的模板的类别，设为第类，若此类就是此样本所在的类别，则否则，为循环次数。循环次数增加。直到循环次数大于循环上限时退出循环，结束。训练完成后即可用其分类了。求待分类的矢量与每个模板的距离，距离小的模板对应类别就是分类结果。实验的汉字样本仍为上面用过的三套手写汉字和四套印刷体汉字，训练集与测试集也相同。取级字库的前个汉字实验，即分类的类别总数为。训练速率取，循环上限取即可，由实验可知循环次数超过时识别率变化不大了。表二十是对各种不同维数改进的矩形弹性网格黑像素分布特征实验的识别率。仍然使用边缘梯度方向角分解......”。

7、“.....识别率随网格特征的维数增加而增加，并且对测试集和对训练集的识别率非常接近，然而，与模板分类器分类结果比较，网络分类的识别率远差于模板分类器。可见，在求每类别的模板时，简单的求平均比用训练算法更好。隐马尔可夫过程分类器把特征的每个分量的出现看作是个隐马尔可夫过程个状态转移的马尔可夫链以及在链上每个状态的观察值。设为状态数目为可能出现的观察值数目是马尔可夫链的状态转移矩阵，为矩阵，分量表示第状态转移到第状态的概率是观察值矩阵，为矩阵，分量表示第状态下观察值出现的概率。由隐马尔可夫过程得到观察值序列的步骤如下开始处于状态根据转移概率转移到下状态，设为根据状态的观察值概率得到个观察值重复和，直到获得特定长度的观察值序列。对于给定的隐马尔可夫过程参数和观察值序列......”。

8、“.....因此，若把汉字特征看作观察值序列，通过训练对每个汉字建立个隐马尔可夫过程，那么对待识别的汉字，计算在每个汉字对应的隐马尔可夫过程下，这个待识别汉字的观察值序列出现的概率，概率大的隐马尔可夫过程对应的汉字就是识别结果。对每个汉字建立隐马尔可夫过程，就是对隐马尔可夫过程的训练，可以使用算法，此算法需要输入矩阵的初始值，考虑到各个状态地位相等，对转移矩阵，每个状态转移回到自身的概率取到均匀分布的随机值，转移到其他状态的概率均等对观察值矩阵，每个状态下各个观察值出现的概率相等。输入为同个汉字的训练样本集，训练的目标是使训练样本集的观察值序列有尽可能高的出现概率。注意，训练每个汉字对应的隐马尔可夫过程只需要输入此汉字的训练样本集，不需要输入其它汉字的训练样本，这是和神经网络不同的地方。将隐马尔可夫过程用于改进的矩形弹性网格黑像素分布特征的识别。考虑到矢量的每个分量是个比例，不会超过......”。

9、“.....则保留的整数部分的值将会出现个，分别是„。这个值就是可能的观察值，因此观察值数目。为确定状态数，下面进行实验。实验的汉字样本仍为上面用过的三套手写汉字和四套印刷体汉字，训练集与测试集也相同。汉字特征是边缘梯度方向角分解的改进的两层矩形弹性网格黑像素分布特征维矢量。待识别的汉字是级字库前个汉字，即总类别数为。表二十二是不同状态数下的识别率。图三十九是使用表中的数据绘制的识别率随隐马尔可夫过程状态数变化图。状态数对测试集仿宋体识别率对训练集第套手写识别率对训练集宋体识别率表二十二隐马尔可夫过程分类不同状态数下的识别率状态数识别率测试集识别率训练集手写汉字识别率训练集宋体识别率图三十九表二十二的识别率随状态数变化图从表二十二和图三十九可以看出，状态数在小于的时候，识别率随状态数的增加而增加，状态数超过后，识别率变化不大。因此，可以取状态数，状态数太多只会增加训练和识别汉字的时间，对识别率影响不大而状态数太少则识别率太小......”。

温馨提示：手指轻点页面，可唤醒全屏阅读模式，左右滑动可以翻页。