• / 160
  • 下载费用:5 赏金  

基于PCA与多视图学习的中文文本分类研究.pdf

关 键 词:
635630 基于 PCA 视图 学习 中文 文本 分类 研究
资源描述:
随着信息时代的来临,电子文本信息迅速膨胀,如何有效地组织和管理这些信息,并准确、全面、快速地将用户所需要的信息从文本信息系统中选取出来成为当前信息科学和技术领域的一大挑战。文本分类技术作为文本信息处理领域的关键技术之一,在较大的程度上解决了信息混乱的问题。
   文本分类面临的一个主要问题就是在用向量空间模型表示文本时,向量空间的维数过高,这样就造成了分类算法的计算复杂度很高。首先要进行特征选择,常用的特征选择方法包括:信息增益、互信息、χ2 统计、期望交叉熵、词频方法、文档频次方法、文本证据权等。本文是从多种特征选择函数的差异性着手进行研究的。
   本文的主要工作包括以下内容:
   1.本文在各特征选择函数之后应用了主成分分析(Principal Component Analysis)的方法,它进一步的降低了特征维数并选出更具代表性的特征项。实验表明应用PCA后各分类器的分类性能得到了明显地提高。
   2.本文将PCA 应用到各特征选择函数之后,基于各特征子集的差异性提出了一种改进的多视图学习策略。将PCA 与多视图学习策略相结合应用到文本数据分类中来,实验表明其可行性。
展开阅读全文
  众赏文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
0条评论

还可以输入200字符

暂无评论,赶快抢占沙发吧。

关于本文
本文标题:基于PCA与多视图学习的中文文本分类研究.pdf
链接地址:https://www.xueshudoc.com/p-3195845.html

当前资源信息

编号: 20190314183133263

作者: *****

导师: *****

授予单位: *****

学位: *****

学科专业: *****

年度: *****

在线出版: 2010/10/29 0:00:00

本文目录

    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    浙公网安备 33010902002192号

    众赏文库提供毕业设计,机械图纸源码,实习报告等文档下载

    收起
    展开