检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京城市学院人工智能研究所
出 处:《广西师范大学学报(自然科学版)》2007年第2期157-160,共4页Journal of Guangxi Normal University:Natural Science Edition
基 金:国家863计划资助项目(2005AA147030);国家242信息安全计划资助项目(2005A37);北京市教育委员会科技发展计划面上项目(KM200600006002)
摘 要:自1996年话题发现与跟踪评测启动以来,该研究受到普遍关注,取得巨大进步,也遇到诸多困难。通过分析大量话题数据,提出层次化话题与层次聚类的区别在于话题的层次是由事件的构成决定的,层次化话题应当分为三层,即微类、中类和上类。原因在于计算机自动分析产生的层次化话题必须与现实世界有客观的联系。据此提出一个面向大规模真实数据的有充分理论依据的层次化话题发现与跟踪方法,并在集群系统上予以实现。Since 1996,topic detection and tracking has obtained extensive attention and has encountered great challenge when making great progress. By analyzing mass data, the differences between hierarchical topic and hierarchical clustering are firstly proposed, which should be decided by the construction of event and be represented as three layers, for hierarchical topic produced by computer automatically has external relation with the real world. Then an algorithm for hierarchical topic detection and tracking that can process large-scale data are proposed and implemented on our clusters computer.
关 键 词:话题发现与跟踪 层次化话题识别 层次化话题跟踪 多层聚类 事件结构
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.4