检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京大学计算语言学教育部重点实验室,北京100871
出 处:《中文信息学报》2012年第2期88-91,96,共5页Journal of Chinese Information Processing
基 金:国家自然科学基金资助项目(60973053;91024009);博士点基金项目(20090001110047)
摘 要:百度百科包含了大量的实体和丰富的链接与分类关系,在中文领域含有大量人类知识,能够弥补普通词典词汇覆盖面小的缺点。在商品品牌名称挖掘中,该文提出了发现新的品牌名称的基于图模型的半指导方法。利用百度百科中词条间的相关关系和开放分类,该文使用不同的准则计算词条间的相似度,结合词条和分类的关联性,分类与分类之间的关联性,使用标记传播算法,在130万个词条上进行了品牌名称的挖掘,取得了较好地效果。Baidu baike contains large amount of knowledges on the named entity,the link relationship and the category information.In order to recognize the product(or brand) name from open texts,we propose a graph-based method to discover product name using a few seeds.We incorporate the "related entry" and "open category" structure of baidu baike to reinforce the similarity measures.Applied this method on 1.3 million entries,satisfactory results are achieved for the product mining.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.147