本课题主要采用了过滤式的样本选择方法且包含手工选取样本、最大最小值法选取样本、 多阈值法选取样本以及基于超像素分割选取样本这四种不同的样本选择方法。手工选取样本 是指人工的在差异图上选取发生变化和未发生变化的部分作为训练集;最大最小值法选取样 本是指将差异图上的像素点按照差异值的大小排序,从中选择最大及最小的部分作为训练集; 多阈值法是指设置阈值组来选取样本集;基于超像素分割选取样本是指首先对差异图进行超 像素分割,然后计算超像素的差异特征并排序,从中选取最大及最小的部分作为训练集。 1.2.3 机器学习方法研究
机器学习是人工智能不可或缺的一个研究领域,是指利用数据训练模型并使用模型对数 据进行预测。根据学习方式的不同,机器学习可以分为监督学习(supervised learning)、无监 督学习(unsupervised learning)、半监督学习(semi-supervised learning)以及集成学习(ensemble learning)。监督学习是指利用类别已知的训练样本调整分类器的参数以完成学习的目标;无监 督学习是指全部样本的类别都是未知的,算法通过自学习得到样本的类别属性;半监督学习 的样本包括已知样本和未知样本两部分,通过未知样本的固有结构信息对根据已知样本获得 的拟合分类器进行改进;集成学习是指使用多个学习方法对同一问题进行学习以使得分类器 具有更强的泛化能力[12,13,14]。本课题将使用监督学习中的支持向量机(support vector machines)技术对样本集进行训练 和预测,其中支持向量机适合处理复杂、高维的小样本多维数据分类,被广泛的应用于农业 作物监测、道路信息提取、图像分割等领域[14,15]。
1.3 总体技术方案及其社会影响
本课题首先利用同一地域不同时相的遥感影像构造差异图,然后针对差异图使用以下四 种样本选择方法实现训练样本选择:
(1) 手工选取样本。利用鼠标在差异图上选择亮度较大及较暗的区域作为样本集;
(2) 最大最小值法选取样本。将差异图上的像素点按照差异值的大小排序,从中选择最大 及最小的部分作为训练集;
(3) 多阈值法选取样本。参考 Tan[15]等人的文章,设置阈值组选择样本集;
(4) 基于超像素分割选取样本。对差异图进行超像素分割,之后计算超像素的差异特征值 并排序,从中选择最大及最小的部分作为样本集。
接着运用 SVM 对以上四种不同的样本集进行训练,最后获取遥感图像的变化检测图并据此 对比四种样本选择方法的差异。
本方案从差异图中选取部分具有代表性的区域作为样本集,可以减少 SVM 训练样本集所 需时间,加快学习的速度,还可以提高分类的准确率,避免“过拟合”现象的发生,有效的 节省了社会资源。通过对样本进行训练预测还可以进行遥感影像的自动变化检测,这可以快 速实时的获取城市扩张、自然环境和军事目标等的变化情况,有利于国家对城市发展以及自 然环境变化进行及时的调控,也有利于在军事行动中取得先机。
1.4 技术方案的经济因素分析
本方案的核心思想是利用四种样本选择方法从大量数据中选择少量有代表性的区域作为 训练样本,这可以加快学习的速度,减少分类算法的计算代价,提高了效率,可以在单位时 间内创造更多的价值。相比于全部数据,样本集占用的存储空间更少,使得其存储及传输所 需代价更小;样本集更具有代表性,对样本集进行学习和预测可以提高分类准确率,提升技 术方案的竞争力,更容易转化为经济效益。利用样本选择也可以进行遥感影像的自动变化检 测,这可以实时的获取城市扩张以及自然环境等的变化情况,通过及时的调控可以促进经济 更好的发展。 遥感影像自动变化检测技术中的样本选择研究(3):http://www.chuibin.com/jisuanji/lunwen_205622.html