检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]河北大学管理学院,保定071002 [2]河北大学数学与计算机学院,保定071002
出 处:《计算机科学》2015年第2期233-236,240,共5页Computer Science
基 金:中国博士后科学基金资助项目(20070420700);河北省自然科学基金资助项目(F2011201146);河北省科技计划项目(13450337)资助
摘 要:在贝叶斯信念网络的基础上,给出了一个新的动态话题追踪模型作为文章的表示模型。依据时间距离量化动态话题追踪中的时序信息,并将其应用于特征权重的动态调整。考虑到较长时间没有再现的特征权重应该衰减,给出了权重衰减函数,若衰减后的特征权重低于一定的阈值,则将其视为冗余信息。实验采用TDT4测试集合和DET曲线进行评测,通过反复实验获得基于TDT语料的最优时间距离阈值α和决定是否为冗余特征的阈值β。实验证明,使用时序权重后可有效提高动态话题追踪模型的追踪性能。A new dynamic topic tracking model was proposed based on Bayesian belief network,which is used as the representation model in this paper.We used time distance to quantify temporal information which is then used to dynamically adjust feature weight.A weight decay function was given to deal with the long-time disappearing features.If the weight of a feature is lower than the given threshold after decaying,the feature will be viewed as redundant information.TDT4 corpora and DET curves were used to run experiments.We firstly obtained the optimal time distance thresholdαand the thresholdβto determine whether a feature is redundant information.Experimental results show that the tracking performance of dynamic topic models can be effectively improved by using temporal weight.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145