一种基于粗糙集的微博文本特征选择方法  被引量:4

Micro Blog Text Feature Selection Based on Rough Set

在线阅读下载全文

作  者:杜锐[1] 朱艳辉[1] 鲁琳[1] 邓程[1] 梁韬[1] 

机构地区:[1]湖南工业大学计算机与通信学院,株洲412007

出  处:《科学技术与工程》2013年第33期9830-9834,9842,共6页Science Technology and Engineering

基  金:国家自然科学基金资助项目(61170102);湖南省自然科学基金资助项目(10JJ3002);国家社科基金资助项目(12BYY045);教育部人文社会科学研究青年基金资助项目(09YJCZH019) 资助

摘  要:对中文微博中主客观分类特征的选取进行了研究。通过词典与统计相结合的方法提取了基础情感词、语气词、程度词等8个候选特征。对提取的候选特征,提出了一种基于粗糙集与概率加权的特征选择算法,通过该算法最终选取了基础情感词、!或!、网络观点词、语气词、形容词、程度词作为分类特征。实验结果表明,提出的方法能达到较好的分类效果。The feature selection of subjective and objective classification of Chinese micro blog habeen stud- ied. Fothe featurein Chinese micro blog, the combination of lexicon and statisticiused to extraccandidate features. By thimethod, eighcandidate featureare extracted. And feature selection algorithm based on rough setand probability-weighted iproposed. Using the algorithm, six featureare selected. The experimenresulshowthathese featureselected by the algorithm achieve good resulin subjective and objective classification of Chinese micro blog.

关 键 词:粗糙集 微博 观点句 识别 

分 类 号:TP391.31[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象