国家教育部博士点基金(20090001110047)

作品数:5被引量:25H指数:3
导出分析报告
相关作者:王厚峰陈晨焦妍张龙凯何正焱更多>>
相关机构:北京大学更多>>
相关期刊:《中文信息学报》更多>>
相关主题:模块度消歧谱聚类同名社会网络更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-5
视图:
排序:
商品品牌名称挖掘被引量:1
《中文信息学报》2012年第2期88-91,96,共5页何正焱 王厚峰 
国家自然科学基金资助项目(60973053;91024009);博士点基金项目(20090001110047)
百度百科包含了大量的实体和丰富的链接与分类关系,在中文领域含有大量人类知识,能够弥补普通词典词汇覆盖面小的缺点。在商品品牌名称挖掘中,该文提出了发现新的品牌名称的基于图模型的半指导方法。利用百度百科中词条间的相关关系和...
关键词:商品名挖掘 半监督学习 图算法 
基于条件随机场与Web数据的缩略语预测被引量:3
《中文信息学报》2012年第2期62-68,共7页焦妍 王厚峰 张龙凯 
国家自然科学基金资助项目(60973053;91024009;90920011);核高基资助项目(2011ZX01042-001-001);博士点基金资助项目(20090001110047)
缩略语在自然语言中被广泛使用。因其是新词的重要来源之一,成为了自然语言处理领域的一大问题。该文以汉语为对象,研究了从完整形式预测缩略语形式的方法。首先,使用条件随机场模型对完整形式进行序列标注,生成缩略语候选集合。再利用...
关键词:缩略语 CRF模型 网页数据 
汉语缩略语自动处理研究现状被引量:7
《中文信息学报》2011年第5期60-67,82,共9页王厚峰 
国家自然科学基金资助项目(60973053;91024009);高校博士点专项基金资助项目(20090001110047)
缩略语是自然语言中广泛使用的一类典型语言单元,也是最主要的新词来源。而新词会造成自然语言处理多个层面的困难。该文分析了汉语缩略语的特点,对汉语缩略语的构成形式作了总结,对汉语缩略语处理的问题作了划分,并针对不同的问题,重...
关键词:缩略语识别 缩略语扩展 缩略语预测 缩略语挖掘 
基于社会网络的跨文本同名消歧被引量:13
《中文信息学报》2011年第5期75-82,共8页陈晨 王厚峰 
高校博士点专项基金资助项目(20090001110047);国家自然科学基金资助项目(60973053;91024009)
跨文本人名消歧是判断出现在不同文本的相同人名是否指称现实中相同实体的过程。跨文本人名消歧是准确获取感兴趣人物相关信息的基础,对多文本摘要、信息融合等具体应用也有重要的作用。该文运用社会网络分析法消歧中文不同文本同名歧...
关键词:计算机应用技术 人名消歧 社会网络 谱聚类 停止条件 模块度 
计算语言学歧义消解研究——兼介绍北京大学计算语言学教育部重点实验室被引量:3
《术语标准化与信息技术》2010年第3期25-28,共4页王厚峰 
国家自然科学基金项目(60973053);高等学校博士点专项基金项目(20090001110047)资助
本文介绍了近年来计算语言学歧义消解中的典型方法以及重点研究问题,并简要介绍了北京大学计算语言学教育部重点实验室的发展情况以及目前的重点研究方向。
关键词:歧义消解 机器学习 计算语言学 
检索报告 对象比较 聚类工具 使用帮助 返回顶部