检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《数据采集与处理》2016年第2期296-306,共11页Journal of Data Acquisition and Processing
基 金:国家重点基础研究发展计划("九七三"计划)(2013CB329605)资助项目
摘 要:提出一种统计和规则相结合的最长评价短语自动识别算法。将评价短语的识别问题转化为序列标注问题,结合条件随机场模型进行简单结构的评价短语识别,在此基础上进一步建立和应用规则库,自动识别结构复杂的最长评价短语,其测试的F值达到72.38%。在最长评价短语自动识别的基础上,构建用于评价对象抽取和情感评价单元抽取的规则库,提出基于规则的评价搭配自动抽取算法,实现评价对象和最长评价短语搭配的自动抽取,在网易汽车门户网站进行了系统测试,得到了较高的准确率。An algorithm based on statistics and rules is proposed to automatically identify maximal‐length evaluation phrase .The identification of evaluation phrase is taken as sequence tagging problem .Then conditional random field model is used to recognize evaluation phrase with simple structure .Therefore , rule database is established and maximal‐length evaluation phrase with complex structure is identified au‐tomatically .F‐measure value reaches 72 .38% .Based on the above work ,rule base is constructed for ex‐tracting opinon target and appraisal expression .Rule‐based extracting appraisal expression is proposed to automatically extract opinion target and maximal‐length evaluation phrase .Experiments were conducted at netease car portal and got a higher precision .
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30