基于减少相似主题分类错误的权重分配新策略  

A New Method of Weight Distribution Based on Reducing the Error in Similar Classes

在线阅读下载全文

作  者:唐焕玲[1,2] 王敬东 陆玉昌[4] 

机构地区:[1]烟台职业学院计算机专业教研室 [2]中国工商银行烟台市分行信用卡业务部,山东烟台264001 [3]中国工商银行烟台市分行信用卡业务部 [4]清华大学计算机科学与技术系

出  处:《计算机工程与应用》2004年第13期185-188,共4页Computer Engineering and Applications

基  金:国家自然科学基金重大项目(编号:79990580);国家973重点基础研究发展规划项目(编号:G1998030414)资助

摘  要:文本分类的研究者一直在提高文本的分类精度方面做着不懈的努力,在实验中发现,相似主题的文档的分类错误率比较高,该文尝试着提出了一种二次权重分配的新的特征权值分配策略,构造了一种计算难以区分的主题类别的特征辨别能力的权值函数,目的是减少相似主题类别的文档的分类错误。The researchers on text classification are working assiduously in promoting the precision of classification.In many experiments,we find that the error rate is high in the documents of similar classes,therefore,we attempt to point out a new weight distribution method which named second weight distribution.We define a function which can measure the strength of different feature term in distinguishing a pair of hard and similar classes so that the error rate in the documents of similar classes can be reduced.

关 键 词:向量空间模型(VSM) 特征选择 权值调整 贝叶斯分类 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象