一种富文本分类方法的设计和实现  被引量:2

A DESIGN AND IMPLEMENTATION OF A RICH FORMAT TEXT CLASSIFICATION APPROACH

在线阅读下载全文

作  者:朱斐[1] 刁红军[1] 吕强[1] 

机构地区:[1]苏州大学计算机学院,江苏苏州215006

出  处:《计算机应用与软件》2007年第12期121-122,127,共3页Computer Applications and Software

摘  要:综合考虑了富文本中的标题、关键词、主题、结构、词形、风格等描述信息,实现了一种富文本分类的方法。根据描述信息的范围和影响力不同给予相应的权重,改进了传统文本分类算法,使具有明显分类特征的特征发挥了较好的分类效果,抑制了权重较小的特征的干扰。实验表明,这种方法具有较好的准确率和召回率。Considering the describing information of title,keywords,subject, structure,style and morphology in rich format text,rich format text classification is implemented. Relative weights are offered to the describing information according to the effect range and degree,which im- proves conventional plain text classification algorithms, This enhanced weighting method leads to better classification result produced by the features with obvious classification characteristic, The interference of features with less weight is lessen, Experiment shows that the approach is of pretty good precision and recall rate.

关 键 词:文本分类 富文本分类 OpenDocument分类建模 特征选择 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象