检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:黄颖[1]
机构地区:[1]赣南师范学院数学与计算机科学学院,江西赣州341000
出 处:《计算机与现代化》2012年第1期6-9,13,共5页Computer and Modernization
基 金:江西省教育厅科技项目(GJJ11216);赣南师范学院校级科研课题(10KYZ05)
摘 要:目前,话题检测与跟踪已被广泛应用,新事件检测作为话题检测与跟踪领域中的研究任务之一,为跟踪后续话题发展的先验知识,在话题检测与跟踪领域具有重要的理论研究意义。LDA主题模型不能自动识别新事件,其主题数需通过人工或反复实验来确定,识别效率低。本文提出基于LDA及主题词间的相关性新事件检测算法,同时结合报道发生的时间,确定合理的主题数目,从而探知新事件。实验证明,与传统LDA算法及Gibbs LDA算法相比,该方法具有一定优势,提高了对新事件检测的敏感度。Topic detection and tracking(TDT) is widely used. As one of research tasks for TDT, new event detection can provide prior knowledge to TDT, so it is of great theoretical research significance in the field of TDT. Because LDA model can not auto- maticaUy identify new events, and the number of LDA topic is determined by the artificial, or by repeated experiments, it is of low efficiency. This paper presents a new method based on LDA and correlation of topic terms, which considers the correlation of subject terms and report time, it can dynamically adapt updated topics and then detect the new event. Experiment results demon- strate that this method is of some advantages and the sensitivity of new events detection is increased.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.148.200.145