毕业论文

打赏
当前位置: 毕业论文 > 计算机论文 >

基于android通讯与游戏的手机应用的设计与实现(5)

时间:2025-06-02 10:44来源:99868
国内的文本分类研究始于上个世纪八十年代初期,1981年,南京农业大学侯汉清教授研究系统的总结了国外的文本分类研究综述,开启了国内对于文本分类

国内的文本分类研究始于上个世纪八十年代初期,1981年,南京农业大学侯汉清教授研究系统的总结了国外的文本分类研究综述,开启了国内对于文本分类的研究。主要研究方向在于特征向量化、特征降维算法、中文分词、智能分类算法方向。比如,清华大学、北京大学、上海交通大学、复旦大学等学校都对中文文本分类进行深入研究。文本分类研究热点主要包括以下几个:

(1)文本预处理算法包括中文词频统计、特征提取和特征向量化,常见的方法有TF、TF-IDF[12]、潜在语义检索[24]。

(2)应用于文本分类中的分类算法包括K近邻分类[11.12]、贝叶斯分类[13]、Rocchio分类[14]、决策树分类[15]、支持向量机[16]以及不同算法的组合[17] 。

尤其是近几年随着大数据云计算兴起后,实现了很多以前难以实现的难题,使得大数据集的存储和计算能够完成,而海量文本就是大数据集的典型应用,所以结合Hadoop和文本分类的研究,近几年国内也开始有一些相关的文献。如上海交通大学[29]首先结合了Hadoop和文本分类进行相关的研究,华中师范大学[30]基于Hadoop的MapReduce开发SKNN的文本分类算法。国内的互联网企业也相应的研究基于Hadoop的文本分类算法,并应用于网页分类、邮件识别、用户浏览行为研究等。

1.3 主要工作

    基于大数据的银行客户异常行为分析模型构建。首先设计课题的主要任务是理解我所要收集的的银行客户行为的相关数据以及数据的来源,之后去学习数据挖掘相关的知识与技术方便后面课题研究的专业以及实用性,第三步整合与检查所收集到的数据,这里做特别说明由于银行客户的数据的保密性这里数据可能只是收集来的大量银行客户数据的分析结果。在数据的整理中去除错误以及不一致的数据。在数据处理以及前期的学习阶段会耗费大量的时间以及精力。

    在数据的收集以及整理工作结束以后就是对我们需要完成的数据模型的建立和假设,之后才是实际的数据挖掘的课题研究工作。

    而在课题的最后阶段我们就得对我们建立的初步模型的测试以及验证挖掘结果最后对我们的模型进行解释和应用。

1.4 论文组织结构

    本文基于大数据的银行客户异常行为分析模型构建 ,此次论文主体部分分为四个章节,以下就是论文主体的安排:

第一章,主要的内容就是介绍了本文的主要研究背景,以及大数据方向在国内外的研究现状以及文本分类的研究现状。

第二章,本章是基于我们要用到的大数据相关的技术以及知识为后面课题研究提供相应的专业知识,那么本章主要是介绍了我们在数据模型建立的过程中即将用到的一些数据技术以及基础知识的了解

第三章,主要是我们课题研究以及模型建立的过程以及验证,主要的内容有登入事件检测的时序图,流程图以及数据的求解过程还是最重要的一点是我们课题研究过程中我们实验的整体流程最后说明了我们的模型的建立以及最后的模型验证。

第四章,这是本课题及论文的结尾处主要是本论文的全程工作总结以及对我们课题后期研究的展望以及一些方向。

最后的部分就是总结了课题研究中导师的耐心指导和课题中困难的客服。

基于android通讯与游戏的手机应用的设计与实现(5):http://www.chuibin.com/jisuanji/lunwen_205603.html
------分隔线----------------------------
推荐内容