检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]教育部-微软语言语音重点实验室(哈尔滨工业大学),黑龙江哈尔滨150001 [2]东北林业大学信息与计算机工程学院,黑龙江哈尔滨150040
出 处:《软件学报》2012年第2期289-298,共10页Journal of Software
基 金:国家自然科学基金(60736014;60773069;61073130);国家高技术研究发展计划(863)(2006AA010108)
摘 要:从网络信息的动态演化性出发,对同一话题不同时序阶段的文档集合进行识别和分析,在度量演化内容差异性的基础上实现动态性,给出了两种实现动态多文档文摘的模型,即基于矩阵子空间分析和基于文本相似度累加的动态多文档文摘模型.在此基础上,提出了高效的动态句子加权方法.TAC 2008的Update Summarization测试数据上的实验证明了所提出的动态多文档文摘模型的有效性.This paper introduces two models to describe dynamic evolution of network information: identify and analysis the document collection on the same topic in different stages. In order to construct dynamic of evolution content differences, two dynamic multi-document summarization models are presented, which are matrix subspace analysis model, text similarity cumulative model. Based on these models, some efficient dynamic sentence weighting algorithms are implemented. Experiments on the test data of Update Summarization in TAC 2008 and comparative results between new models and TAC 2008 evaluation, shows the effectiveness of the models.
关 键 词:多文档文摘 差异性分析 矩阵模型 相似度累加 动态演化
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.31