• / 61
  • 下载费用:5 赏金  

融入本体的问题特征模型在中文问题分类中的研究.pdf

关 键 词:
1282970 融入 本体 问题 特征 模型 中文 分类 中的 研究
资源描述:
问答系统作为自然语言处理领域中的一个相当活跃的分支,所研究的内容就是理解用户用自然语言提出的问题,进而在大规模的信息中自动地给出问题的准确答案。问答系统通常包括问题处理、信息检索和答案抽取三个模块,而在问题处理模块中,问题分类又是其中的核心内容,问题分类不仅能有效地减少候选答案的空间,提高系统返回答案的准确率,而且它提供的答案类型信息决定了答案抽取策略。  问题分类的首要任务是问题数据的数学表示,即选用合理的问题特征模型对问题进行特征表示,而一个高性能的特征模型将对后续的问题分类具有非常重要的作用,因此本文重点对问题的特征模型进行了详细的探讨,在对相关技术进行全面学习和深入研究的基础上,重点进行了以下几方面的工作:  1.本体是语义Web中解决语义层次上万维网信息共享和交换的基础。  本文在深入研究本体技术的基础上,利用protégé工具构建了一个实验性质的大学领域本体知识库(UniversityDomainOntology,UDO),作为中文问答系统在问题处理时应用的领域本体,旨在探索领域本体在中文问答系统中的作用。然后利用Jena工具包对本体知识库进行了解析,并按照树型结构存储到mysql数据库中,从而实现了OWL到关系型数据库的映射,为后续问题处理方面的研究奠定了基础。  2.深入研究了信息论中的信息熵理论和相关算法,提出了一种计算问题特征向量的权重的新策略。本文以大学领域本体知识库UDO为基础,引入信息论中的信息熵概念,利用向量空间模型中特征词权重的信息熵算法并融合本体概念模型来构建问题的特征模型。  3.支持向量机(SupptVectMachine,SVM)作为一种基于统计学习理论的新型机器学习方法,以其良好的分类性能受到广泛关注,取得了丰硕的研究成果。它在解决小样本、非线性及高维数等问题中表现出许多特有的优势。本文在分析、总结支持向量机的原理和多类分类方法的基础之上,将其应用在中文问题分类中,验证了本文提出的问题特征模型的有效性,并通过对比实验,比较了各种多类分类算法的性能。
展开阅读全文
  众赏文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
0条评论

还可以输入200字符

暂无评论,赶快抢占沙发吧。

关于本文
本文标题:融入本体的问题特征模型在中文问题分类中的研究.pdf
链接地址:https://www.xueshudoc.com/p-3195849.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

浙公网安备 33010902002192号

众赏文库提供毕业设计,机械图纸源码,实习报告等文档下载

收起
展开