检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杜锐[1] 朱艳辉[1] 鲁琳[1] 邓程[1] 梁韬[1]
机构地区:[1]湖南工业大学计算机与通信学院,株洲412007
出 处:《科学技术与工程》2013年第33期9830-9834,9842,共6页Science Technology and Engineering
基 金:国家自然科学基金资助项目(61170102);湖南省自然科学基金资助项目(10JJ3002);国家社科基金资助项目(12BYY045);教育部人文社会科学研究青年基金资助项目(09YJCZH019) 资助
摘 要:对中文微博中主客观分类特征的选取进行了研究。通过词典与统计相结合的方法提取了基础情感词、语气词、程度词等8个候选特征。对提取的候选特征,提出了一种基于粗糙集与概率加权的特征选择算法,通过该算法最终选取了基础情感词、!或!、网络观点词、语气词、形容词、程度词作为分类特征。实验结果表明,提出的方法能达到较好的分类效果。The feature selection of subjective and objective classification of Chinese micro blog habeen stud- ied. Fothe featurein Chinese micro blog, the combination of lexicon and statisticiused to extraccandidate features. By thimethod, eighcandidate featureare extracted. And feature selection algorithm based on rough setand probability-weighted iproposed. Using the algorithm, six featureare selected. The experimenresulshowthathese featureselected by the algorithm achieve good resulin subjective and objective classification of Chinese micro blog.
分 类 号:TP391.31[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.17.164.81