检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张祯[1] 樊兴悦 郭禹田 吴国华[1] ZHANG Zhen,FAN Xingyue,GUO Yutian,WU Guohua(School of Cyberspace Security,Hangzhou Dianzi University,Hangzhou 310018,Chin)
机构地区:[1]杭州电子科技大学网络空间安全学院,杭州310018
出 处:《计算机工程》2018年第6期169-175,共7页Computer Engineering
基 金:国家部委基金
摘 要:目前针对动态文摘的研究关注对象主要是多文档集合,其中内容随时间而更新演化,但动态文摘中存在高冗余、新颖信息丢失等问题,会影响文摘提取质量。为此,研究Topic Signature模型,并在其基础上提出一种新的整数规划动态文摘更新方法。根据句间相似度对每条语句的主题代表性和信息多样性进行评分,利用Topic Signature模型评估语句的新颖性,以提取事件中的更新演进信息。在此基础上,依据摘要生成策略,缩小解的可行域,以保证在短时间内生成高质量的文摘。实验结果表明,该方法无需进行模型训练和语言匹配,能够有效降低时间复杂度,提高文摘提取效率。The dynamic summarization is to construct evolutionary content of collection.But there are some complicated problems in dynamic summarization,such as information redundancy,novelty information easily lost.To solve the above problems,this paper proposes an Integer Linear Programming(ILP) dynamic summarization update method based on Topic Signature model.According to the similarities between sentences,it calculates the representativeness score and diversity score for each sentence and introduces the Topic Signature model to determine the novelty of the sentences.Based on the summary generation strategy,the feasible region of understanding can be reduced and the high quality abstracts can be generated in a short time.Experiment result shows that the proposed method can effectively reduce the time complexity and improve the efficiency without model training and language matching.
关 键 词:动态文摘 TOPIC Signature模型 密度峰值 整数规划模型 自然语言处理
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30