检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王凯祥 任明[1] WANG Kaixiang;REN Ming(School of Information Resource Management, Renmin University of China, Beijing 100872, China)
机构地区:[1]中国人民大学信息资源管理学院,北京100872
出 处:《中文信息学报》2019年第4期93-100,共8页Journal of Chinese Information Processing
基 金:国家自然科学基金(71402186)
摘 要:针对新闻文本领域,该文提出一种基于查询的自动文本摘要技术,更加有针对性地满足用户信息需求。根据句子的TF-IDF、与查询句的相似度等要素,计算句子权重,并根据句子指示的时间给定不同的时序权重系数,使得最近发生的新闻内容具有更高的权重,最后使用最大边界相关的方法选择摘要句。通过与基于TF-IDF、TextRank、LDA等六种方法的对比,该摘要方法 ROUGE评测指标上优于其他方法。从结合评测结果及摘要示例可以看出,该文提出的方法可以有效地从新闻文档集中摘取核心信息,满足用户查询内容的信息需求。This paper proposes a query based automatic text summarization method,which is targeted to meet users'information needs of news.It assigns the weight of the sentence according to the TF-IDF,the similarity of sentence to the query,and the time of the sentence indicating(with a bias favoring the recent news).Finally,the method of the Maximal Marginal Relevance is used to select the summary sentence.Compared with six existing methods,the method proposed in this paper is superior in terms of ROUGE.
关 键 词:自动文本摘要 基于查询的摘要 新闻文本 分布式表示
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.40