在人类文明的进步中,数字一直是人们沟通交流的主要工具,它无关风俗文化背景,无关种族语言背景,它是人类文化文明的象征。这些数字作为世界经济发展的信息载体,显示了世界各民族人民的生活认知和思维方式。在我们的日常生活中,我们每天都要做大量的文件处理工作,如分数,银行账单、财务报表、统计报表、汇票、信用处理卡片账单以及邮政编码的分类等。利用计算机来代替人去识别手写数字,解放大量劳动力,已经成为亟待解决的问题。
1.2 手写数字识别研究的发展及研究现状
1.3 本论文所做的工作
手写数字识别的研究的最终目的是设计出一种快速高效,准确性高的识别系统,并将其应用于实际生活工作中。通常来讲,在对于数字识别的过程中,我们往往对其有较高的要求,尤其是对于数字识别的准确性。针对于这个要求,我们在设计手写数字识别研究当中,对其提出了一些新的要求,研究过程中最关键步骤之一就是设计一种准确性高的手写数字识别方法,同时要保证它具有一定的可靠性。不过到目前为止,机器识别的准确性还没有达到人的要求。
为了研究手写数字的识别,将起到系统分成了三个部分:首先是预处理,其次是特征提取,最后是建立模型。在将识别算法应用于数字识别之前,首先要对数字图像进行相关的预处理,然后再进行特征提取,因为这样才可以有效的保证获得算法识别所需要的数据。同时,我们一定要注意的就是在手写数字识别的研究过程中,要学会根据不同的处理步骤,来选用不同的使用方法。在进行图像预处理时,一般包括以下几个步骤:读取图像、灰度化、二值化、去噪锐化、调整斜度、图像分割、归一化、细化,这样处理完的图像便于特征提取。特征提取的主要方法大致有三种,而本文使用的就是逐像素提取的方法,它最主要的的优点就是计算起来简单,同时训练速度快。最后进行模型的建立,包括输入输出神经元的数目确定以及潜藏层激励函数的选取。
本文主要使用matlab软件和rands函数来实现数据的初始化,同时这个系统的输入层只有一层,而且输入层的神经元的数目是35,潜藏层一层,潜藏层为25,输出层一层,输出层的神经元数量是10,学习速率为0.1,潜藏层的激励函数为sigmoid函数[5]。随机选取4500个图像进行提取,根据公式计算潜藏层和输出层输出误差,更新网络权值。
处理的数据集是放在10个文件夹里,文件夹的名称对应存放的手写数字图片的数字,每个数字500张,每张图片的像素统一为28*28。数据集中一共有5000张手写的数字图片,而且这些都是经过预处理后的图像,从中随机选取4500张图用来训练神经网络,在将剩余的500张用来进行预测识别。
BP神经网络具有自适应、自学习、高度容错性和并行处理信息的能力,所以神经网络在很多领域都有应用,尤其是字符识别领域应用更广。本文是基于BP算法的神经网络,构造的手写数字识别分类器,运用4500张数字图像进行学习训练,建立模型,并用余下的500张数字进行测验,检测神经网络的泛化能力。
2 神经网络
2.1 人工神经网络简述
神经元又叫神经细胞,神经元的大小形状各不相同,但他们的基本结构差不多。神经元是构成神经系统的基本单位,它也是神经网络的一个基本处理单元,同时更是人工神经网络(Artificial Neural Network, ANN)的设计基础。
2.1.1 人工神经网络发展经历
早期阶段
大约在20世纪40年代初期,就有美国的心理学家和数学家通过合作来做实验研究,根据对生物神经元的基本特点的学习,提出了像神经元的数学模型,即MP模型,用严谨的数学来描述在神经网络中的客观世界,从此开创了神经元科学发展的新时代。1949年,心理学家D.O.Hebb提出一个大胆的假设,他认为,神经元之间的网络连接权可以被纠正,然后提出了学习指导方针,为神经网络学习算法,30年后,证实了他的假设是对的。1957年,Frank Rosesenblatt带头将对神经元的研究从理论转向实际工程,他引进制作了感知器,想要尝试通过模拟动物或人类的学习认知,以此将大家对神经网络的研究热情推向了发展高潮。早在1962年的时候,Widrow以及他的学生,就提出了一种叫做自适应线性元件[6]。 基于BP神经网络的手写数字识别研究(3):http://www.chuibin.com/jisuanji/lunwen_206214.html

