动态流形方法在多文档文摘模型上的应用  

Application of Dynamic Manifold Method in Multi Document Summarization Model

在线阅读下载全文

作  者:刘美玲 郑德权[2] 王慧强[3] 于洋 

机构地区:[1]东北林业大学信息与计算机工程学院,黑龙江哈尔滨150040 [2]哈尔滨工业大学教育部-微软语言语音重点实验室,黑龙江哈尔滨150001 [3]哈尔滨工程大学计算机科学与技术学院,黑龙江哈尔滨150001

出  处:《计算机技术与发展》2018年第3期26-31,共6页Computer Technology and Development

基  金:中央高校基本科研业务费专项资金(2572014CB26);黑龙江省自然科学基金(F2015037)

摘  要:网络动态演化内容的识别和分析是人们快速获取有效信息的主要手段之一,已经成为人们迫切需要解决的关键问题。动态多文档文摘建立在时间信息基础上,从网络动态演化性出发,对同一话题不同时段的文档集合进行分析,在识别信息内容差异性的基础上,对信息的动态演化性进行建模。文中在经典流行排序思想的基础上,进一步提出了动态流行排序模型。该模型中不仅融入了信息的重要性特征,而且融入了信息与历史信息的关联特征以及信息的时间特征,使文摘信息动了起来,即文摘系统具有了动态性。该模型在国际标准评测TAXT ANYNASIS CONFERENCE 2008的Update task任务语料上进行了测试,获得了较好的实验结果。The identification and analysis of evolutionary information on the internet is an efficient means to get useful information,which has become a critic issue urgent to work out.Based on time information,starting from network dynamic evolution,the dynamic multi_document summarization analyzes the document sets of different period about a same topic.On the basis of identifying the difference of information content,a summarization model can be built.Based on the classic manifold ranking model,we propose a dynamic manifold ranking model which not only adds some significant features,but also introduces some historical redundancy features and some time information feature,which make the information contained by abstract dynamic. An evaluation based on this model is conducted on the update task corpus of TAXT ANYNASIS CONFERENCE 2008 and a good testing result is obtained.

关 键 词:动态多文档文摘 动态演化性 差异性分析 相似度 质心整体选优 

分 类 号:TP39[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象