检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:潘霄[1,2] 余正涛[1,2] 郭剑毅[1,2] 毛存礼[1,2] 杨秀贞[1]
机构地区:[1]昆明理工大学信息工程与自动化学院,云南昆明650500 [2]昆明理工大学智能信息处理重点实验室,云南昆明650500
出 处:《中文信息学报》2016年第2期26-31,共6页Journal of Chinese Information Processing
基 金:国家自然科学基金(61175068);云南省软件工程重点实验室开放性基金(2011SE14);国家教育部留学回国人员科研启动基金
摘 要:针对中文专家页面特点,以及用于消歧的基准专家页面中信息涵盖不全的问题,该文提出一种基于特征映射的中文专家消歧方法。首先,采用条件随机场模型,从基准专家页面和待消歧页面中提取出所定义的12维人物属性特征,并利用最大熵分类模型,结合已有消歧结果训练出各属性特征的权重;然后,针对某个专家的基准页面,计算待消歧页面与该页面的相似度,根据设定的阈值判断该页面是否单独成类,若不是单独成类,则利用特征映射,扩充该页面的属性特征,结合模糊聚类方法,得到与该页面为一类的页面。在"自然语言处理"及"机器学习"领域进行中文专家消歧实验,结果表明提出的方法能有效对中文专家页面进行消歧。A Chinese expert page disambiguation method based on feature mapping is proposed according to the characteristics of the Chinese expert page.Firstly,with the help of CRFs model,12 predefined character attributes are extracted from the standard and the candidate page,and their weights are decided by a ME classifier.Then,the page similarity is calculated to decide if the candidate page attributes should be appended Experiments on NLP and ML expert pages show the effectiveness of the proposed method in disambiguation.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145