检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京工业大学信息科学与工程学院,南京210009 [2]安徽师范大学信息管理中心,芜湖241000
出 处:《计算机工程》2010年第9期200-202,共3页Computer Engineering
基 金:国家自然科学基金资助项目(60703071);安徽省高校省级自然科学研究基金资助重点项目(KJ2009A63)
摘 要:基于特征投票机制设计一种线性文本分类方法,运用信任机制理论分析文档类别对特征的信任关系,给出具体特征信任度的模型,并在Newsgroup、复旦中文分类语料、Reuters-21578 3个广泛使用且具有不同特性的语料集上与传统方法进行比较。实验结果表明,该方法分类性能优于传统方法且稳定、高效,适用于大规模文本分类任务。This paper discusses a text categorization approach based on features vote,which is linear as well as high efficient.It uses the trust mechanism theory to analyze the trust relation between features and document classes,and gives the model to calculate the trust values.In the comparison experiments,Newsgroup,Fudan Chinese evaluation data collection and Reuters-21578 are used to evaluate the effectiveness of the techniques.Experimental results show the method can improve the performance for text categorization,and is suitable for large-scale text categorization.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.104