(三)本文的研究工作
分类问题是数据挖掘领域中非常广泛的一部分内容,用于为事物打上特定的标签。分类技术即运用分类方法构建分类模型,根据相应的分类,将输入的数据记录映射到某个给定的类别[12]。预测资助申请是否会成功就是一个分类问题。现有的研究都是基于一种模型对资助申报进行预测,缺乏模型的横向比较,本文采用支持向量机、神经网络、决策树这三种对科研项目申报具有良好的可行性的模型,采用墨尔本大学从2005年底到2008年的资助申请记录作为实验数据[13],包括对应的资助者类型、申请提交的日期、研究领域、课程和学科分类、申请者获得成功拨款的次数、申请者提出的不成功补助申请数量以及发表的不同等级的期刊数量等变量,对资助申请进行预测。并采用识别准确度和ROC曲线[4]对三种模型进行预测效果的评价。本文站在申请者的角度,根据申请者的特点以及历史行为,建立资助申请预测模型,能够让申请者在实施具体的申请前对自己的申请有一个先验性的判断,能够有效减少申请者的无用申请,也有利于减轻资助机构审核的工作量,为资助机构的资助决策提供依据,从而实现双方的共赢。
科研资助申请的分类预测(4):http://www.chuibin.com/shuxue/lunwen_205544.html