检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王素格[1,2] 尹学倩[3] 李茹[1,2] 张杰[3] 吕云云[1]
机构地区:[1]山西大学计算机与信息技术学院,山西太原030006 [2]山西大学计算智能与中文信息处理教育部重点实验室,山西太原030006 [3]山西大学数学科学学院,山西太原030006
出 处:《中文信息学报》2012年第4期98-102,108,共6页Journal of Chinese Information Processing
基 金:国家自然科学基金资助项目(61175067;60970014;60875040);山西省自然科学基金资助项目(2010011021-1);山西省科技攻关项目(20110321027-02);教育部高等学校博士点基金项目(200801080006)
摘 要:该文利用领域本体对产品评论文本中的评价对象进行抽取和整合,在此基础上,建立产品性能的非完备信息系统,将特征的情感倾向寓于特征的权重计算之中。对非完备信息系统,给出了基于差别矩阵的启发式特征约简方法,通过特征降维处理,达到了减少特征的冗余度和数据稀疏性的目的。对降维后的非完备信息系统采用K-Means聚类算法,实现了评价对象情感聚类。为了验证该文提出方法的有效性,在真实汽车评论文本数据上进行实验,实验结果表明,在对特征进行一定程度的降维后,仍表现出较好的聚类效果。Based on the evaluation objects extraction form product review texts via the domain ontology,an incomplete information system for the product performance is established,which deals with the feature sentiment orientation by the feature weighting.A heuristic feature dimension reduction method is proposed based on discernibility matrix to reduce redundancy and data sparsity.K-Means clustering algorithm is utilized for realizing evaluation objects clustering.On the car review corpus,the proposed method produces the best performance after feature dimension reduction in a certainty extent in terms of the sentiment clustering of the evaluation objects.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249