中国科学院合肥物质科学研究院机构知识库

Knowledge Management System of Hefei Institute of Physical Science，CAS

图片搜索

粘贴图片网址

HFCAS OpenIR

	一种基于LDA模型的关键词抽取方法
其他题名	A LDA-based approach to keyphrase extraction
	朱泽德 1; 李淼 2; 张健 2; 曾伟辉 2; 曾新华 2
	2015
发表期刊	中南大学学报. 自然科学版
ISSN	1672-7207
摘要	为解决现有方法未能综合考察文档主题的全面性、关键词的可读性以及差异性,提出一种基于文档隐含主题的关键词抽取新算法TFITF。算法根据大规模语料产生隐含主题模型计算词汇对主题的TFITF权重并进一步产生词汇对文档的权重,利用共现信息排序和选择相邻词汇形成候选关键短语,再使用相似性排除隐含主题一致的冗余短语。此外,从文档统计信息、词汇链和主题分析3方面来进行关键词抽取的对比测试,实验在1 040篇中文摘要及5 408个关键词构成的测试集上展开。结果表明,算法有效地提高文档关键词抽取的准确率与召回率。
关键词	信息抽取关键词抽取 LDA模型主题相似性
收录类别	CSCD
语种	中文
CSCD记录号	CSCD:5501277
引用统计	被引频次：4[CSCD] [CSCD记录]
文献类型	期刊论文
条目标识符	http://ir.hfcas.ac.cn:8080/handle/334002/99439
专题	中国科学院合肥物质科学研究院
作者单位	1.中国科学技术大学自动化系 2.中国科学院合肥智能机械研究所 3.中国科学院合肥智能机械研究所 4.中国科学院合肥智能机械研究所 5.中国科学院合肥智能机械研究所
推荐引用方式 GB/T 7714	朱泽德,李淼,张健,等. 一种基于LDA模型的关键词抽取方法[J]. 中南大学学报. 自然科学版,2015,46.
APA	朱泽德,李淼,张健,曾伟辉,&曾新华.(2015).一种基于LDA模型的关键词抽取方法.中南大学学报. 自然科学版,46.
MLA	朱泽德,et al."一种基于LDA模型的关键词抽取方法".中南大学学报. 自然科学版 46(2015).

条目包含的文件
条目无相关文件。

个性服务

保存到收藏夹

查看访问统计

导出为Endnote文件

谷歌学术

谷歌学术中相似的文章

[朱泽德]的文章

[李淼]的文章

[张健]的文章

百度学术

百度学术中相似的文章

[朱泽德]的文章

[李淼]的文章

[张健]的文章

必应学术

必应学术中相似的文章

[朱泽德]的文章

[李淼]的文章

[张健]的文章

相关权益政策

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

除非特别说明，本系统中所有内容都受版权保护，并保留所有权利。

条目量30057
全文量16096
访问量5030327
下载量1703932