LDA及主题词相关性的新事件检测  被引量:4

New Event Detection Based on LDA and Correlation of Topic Terms

在线阅读下载全文

作  者:黄颖[1] 

机构地区:[1]赣南师范学院数学与计算机科学学院,江西赣州341000

出  处:《计算机与现代化》2012年第1期6-9,13,共5页Computer and Modernization

基  金:江西省教育厅科技项目(GJJ11216);赣南师范学院校级科研课题(10KYZ05)

摘  要:目前,话题检测与跟踪已被广泛应用,新事件检测作为话题检测与跟踪领域中的研究任务之一,为跟踪后续话题发展的先验知识,在话题检测与跟踪领域具有重要的理论研究意义。LDA主题模型不能自动识别新事件,其主题数需通过人工或反复实验来确定,识别效率低。本文提出基于LDA及主题词间的相关性新事件检测算法,同时结合报道发生的时间,确定合理的主题数目,从而探知新事件。实验证明,与传统LDA算法及Gibbs LDA算法相比,该方法具有一定优势,提高了对新事件检测的敏感度。Topic detection and tracking(TDT) is widely used. As one of research tasks for TDT, new event detection can provide prior knowledge to TDT, so it is of great theoretical research significance in the field of TDT. Because LDA model can not auto- maticaUy identify new events, and the number of LDA topic is determined by the artificial, or by repeated experiments, it is of low efficiency. This paper presents a new method based on LDA and correlation of topic terms, which considers the correlation of subject terms and report time, it can dynamically adapt updated topics and then detect the new event. Experiment results demon- strate that this method is of some advantages and the sensitivity of new events detection is increased.

关 键 词:LDA 话题检测 新事件检测 主题词相关性 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象