检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:江伟[1,2] 路松峰[3] 杨莉萍[4] JIANG Wei;LU Songfeng;YANG Liping(Wuhan University of Technology,Wuhan 430070,China;City College,Wuhan University of Science and Technology,Wuhan 430083,China;Huazhong University of Science and Technology,Wuhan 430074,China;Huazhong Agricultural University,Wuhan 430070,China)
机构地区:[1]武汉理工大学,湖北武汉430070 [2]武汉科技大学城市学院,湖北武汉430083 [3]华中科技大学,湖北武汉430074 [4]华中农业大学,湖北武汉430070
出 处:《现代电子技术》2017年第14期81-84,共4页Modern Electronics Technique
基 金:国家自然科学基金资助项目(61173050);中央高校基础研究经费资助项目(2662015QC040)
摘 要:用户评论中存在产品特征表达多样性问题,在细粒度观点挖掘任务中需要对产品特征词聚类。首先,结合不同的语义相似度计算的特点,提出基于语义知识和上下文熵模型的语义相似度混合计算方法,计算抽取得到的特征词语义相似度;然后改进了传统CBC算法,提出适用于产品特征词聚类的CBC-LIKE方法实现聚类。最后在三个领域的真实评论语料上进行实验,对提出的语义相似度计算方法和聚类算法的性能进行了分析。实验结果表明,所提方法是有效的,与另外两种基线方法相比性能较优,取得了较好效果。Aiming at the problem of the various product feature expressions existing in user reviews,it′s necessary to cluster the product feature words in the task of fine-grained opinion mining.According to the calculation characteristics of differentsemantic similarities,a semantic similarity mixture calculation method based on semantic knowledge and context entropy modelis proposed to calculate the extract the semantic similarity of feature words.The traditional CBC algorithm is improved.A CBC-LIKE method suitable for product feature words clustering is proposed.The experiment is conducted for the real review corpus inthree domains.The performances of the proposed semantic similarity calculation method and clustering algorithm are analyzed.The experimental results show that the method is effective,its performance is better than that of other two benchmark methods,which has perfect effect.
分 类 号:TN911-34[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.200