检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨玉珍[1,2] 刘培玉[1,2] 费绍栋[1,3] 张成功[1,2]
机构地区:[1]山东师范大学信息科学与工程学院,济南250014 [2]山东省分布式计算机软件新技术重点实验室,济南250014 [3]山东财经大学图书馆,济南250014
出 处:《自动化学报》2014年第3期471-479,共9页Acta Automatica Sinica
基 金:国家自然科学基金(60873247);山东省自然基金(ZR2012FM038);山东省科技发展计划(2012GGB01194)资助~~
摘 要:话题关联检测的关键任务在于判断给定报道对是否属于同一话题.现有判断方法往往忽略种子事件与其直接相关事件之间的层次关系.为此,通过分析报道内部语义分布规律及篇章结构,并依据语义分布规则,利用语义分布规律改进信息瓶颈(Information bottleneck,IB)算法,用于子话题逻辑语义单元的划分,并利用这些逻辑语义单元表示报道,进行话题关联检测.实验证明该方法有较快的收敛速度,并在一定程度上提高了系统性能.Topic link detection aims to detect whether two given stories talk about the same topic, whose key task is how to represent the story utilizing a proper model. In the previous works, the hierarchical relationship between seed events and its directly related events is ignored. Thus, this paper analyzes the regular pattern of semantic distribution and the structure of a story, and proposes a method to divide a story into several sections of sub-topic features based on the regular pattern of semantic distribution and improved information bottleneck (IB) theory. Then, the story represented by the attributes is utilized to do topic link detection. Experimental result shows that this method has a fast convergent rate, and can improve the performance of the system.
分 类 号:TP274[自动化与计算机技术—检测技术与自动化装置]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.200