面向TDT的动态多文档文摘研究  被引量:2

Research on dynamic multi-document summarization by topic detection and tracking technology

在线阅读下载全文

作  者:刘美玲 赵铁军[1] 郑德权[1] 于摇洋 

机构地区:[1]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001 [2]东北林业大学信息与计算机工程学院,哈尔滨150040

出  处:《哈尔滨工业大学学报》2010年第11期1767-1770,共4页Journal of Harbin Institute of Technology

基  金:国家高技术研究发展计划重点资助项目(2006AA010108);国家自然科学基金重点资助项目(60736044)

摘  要:应用话题检测技术中的聚类思想,分析了动态多文档文摘时间特性.利用时间信息的阈值变化得到不同的多文档聚类结果,进而生成基于动态网页信息数据流的多文档文摘.针对不同阈值的多文档文摘比较,了解时间信息在动态的多文档文摘中的重要性.实验证明在TDT的话题检测技术中,可通过调整α值的方法来平衡TDT的输出结果,进而生成质量更好的动态多文档文摘。In this paper time characteristics of dynamic multi-documents summarization has been analyzed by the clustering idea in topic detection technology.From the change of time information threshold value,differ-ent multi-document clustering and multi-documents summarization for the dynamic Web information data stream can be generated.By compared with different threshold values,the importance of time information in a dynamic multi-document summarization is understanded.Experimental result means that you can counterpoise the output of TDT by adjusting α value and generate better quality dynamic multi-document summarization.

关 键 词:话题检测 时间信息 动态阈值 多文档文摘 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象