检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机应用研究》2003年第9期32-35,共4页Application Research of Computers
基 金:国家"863"计划项目(2001AA114110);福建省科技计划重点项目(2001H023)
摘 要:在介绍文本过滤的背景及传统基于关键词的向量空间方法不足之处的同时,引入了词汇链的概念,提出了基于词汇链表示文本的文本过滤模型,该模型首先对文本进行分析,把文本表示成词汇链的形式,在形成用户初始模板之后,以此模板来进行文本过滤。在用户反馈的基础上,自适应地修改该模板,以适应用户变化的需求及改善系统过滤性能,实验表明,这样的确可以提高系统精度。In this paper we first give some information about the text filtering and the defects in VSM(Vector Support Machine),then we introduce the concept of lexical chain,give a model that build a profile based on lexical chain.We first analyse the text,then express the text with lexical chain.We use this lexicalchained profile to sift the information which may be of the user's interest.A filtering system should be able to adapt to user's interest changes,so we automatically modify the user model to recognize the changes.Experimental results show that the methods can improve the text filtering performance.
关 键 词:词汇链 向量空间 用户模板 文本表示 WORDNET
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.13