专有名词识别

作品数:11被引量:40H指数:3
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:杨季文王蕾刘开瑛李培峰柯修更多>>
相关机构:苏州大学山西大学北京大学复旦大学更多>>
相关期刊:《通讯和计算机(中英文版)》《福建电脑》《计算机应用与软件》《计算机应用研究》更多>>
相关基金:国家自然科学基金山西省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于串频统计的汉语和孟加拉语专有名词识别被引量:2
《现代图书情报技术》2011年第12期31-38,共8页柯修 王惠临 于薇 
中国科学技术信息研究所学科建设项目"自然语言处理"(项目编号:XK2011-6)的研究成果之一
基于Nagao串频统计算法实现汉语和孟加拉语专有名词的识别。提取未经过词性标注的中文和孟加拉语语料中的的n元串,使用改进的SSR算法过滤多余子串,利用字串的相邻字信息计算所有n元串成为专有名词的概率,并据此筛选专有名词。最后,实现...
关键词:专有名词识别 串频统计 Nagao算法 SSR算法 
搜索引擎用户查询中的复杂专有名词识别被引量:3
《计算机工程与应用》2008年第19期153-155,共3页胡学营 刘慧 陆汝占 
专有名词识别(Named-Entity Recognition,NER)是自然语言处理和信息检索的基础。现有的很多文献集中于人名、地名、机构名等的识别,很少涉及到书名和电影名等较为复杂的专有名词。专注于某搜索引擎的用户查询日志中出现的这类复杂专有...
关键词:专有名词识别 网络数据 决策表 切分 
基于最大熵的汉语人名识别方法研究
《福建电脑》2008年第4期72-73,75,共3页牛晓妍 
本文针对人名的特点,建立了特征模板,并在此基础上提取了特征集,利用特征选择算法提取了有效特征,并建立了一个基于最大熵的人名识别模型。基于最大熵模型,探索性地构建了一个人名识别的系统,取得了较好的效果。该系统将潜在人名发现和...
关键词:最大熵模型 专有名词识别 特征 
基于实例和错误驱动的规则学习方法及其应用被引量:1
《计算机应用与软件》2008年第1期162-164,共3页王蕾 朱巧明 李培峰 杨季文 
提出了一种基于实例和错误驱动相结合的规则学习方法。该方法首先将提取的文本中的语法结构信息作为实例,然后采用基于转换的错误驱动学习方法找出这些实例的适用上下文环境,从而建立相应的规则库。此方法提取出的规则完全采用机器学习...
关键词:规则学习 中文信息处理 专有名词识别 
汉语未登录词识别现状及一种新识别方法介绍被引量:3
《计算机应用与软件》2007年第8期213-215,共3页王蕾 杨季文 
未登录词的识别对于各种汉语处理系统不仅有直接的实用意义,而且起到基础性的作用。在大规模中文文本的自动分词中,未被识别的未登录词是造成分词错误的一个重要原因,也成为许多自动分词系统走向应用的瓶颈。首先对未登录词的研究现状...
关键词:专有名词识别 属性标注 错误驱动 规则和实例 
一种基于框架结构的专有名词自动识别方法
《计算机工程与科学》2007年第7期141-144,154,共5页王蕾 李培峰 朱巧明 杨季文 
本文提出了一种基于框架结构的专有名词统一识别方法。该方法首先根据专有名词的成词特点及出现的上下文环境,重新定义语料属性;然后,提出了属性标注点(AP)的概念,对训练语料进行初次标注,并采用错误驱动的学习方法来获取规则;最后,结...
关键词:专有名词识别 框架结构 属性标注 错误驱动 规则和实例 
基于小句相似度计算的专有名词识别被引量:1
《通讯和计算机(中英文版)》2006年第6期18-22,35,共6页朱丽丽 郑家恒 
本文得到国家自然科学基金项目(No.60473139)和山西省自然科学基金项目(No.20051034)的资助,
专有名词识别是中文信息处理领域的一个难题。句子相似度计算方法在中文信息处理领域有着广泛的应用。本文探索性地使用句子相似度计算方法来解决专有名词识别问题,并针对专有名词识别的研究背景对小句相似度计算方法做了一些改进,改...
关键词:中文信息处理 专有名词识别 句子相似度计算 
基于最大熵的汉语人名地名识别方法研究被引量:26
《小型微型计算机系统》2006年第9期1761-1765,共5页钱晶 张杰 张涛 
国家自然科学基金项目(60203010)资助.
构建了一个基于最大熵原理的汉语人名地名自动识别混合模型.该模型分为训练和识别两个模块.先从训练语料中抽取特征,利用最大熵方法对特征进行训练.然后使用经过训练的特征,并结合动态词表和少量规则,对测试文本中的汉语人名地名进行识...
关键词:最大熵模型 专有名词识别 特征提取 语言学规则 
基于动态规划算法的专有名词切分被引量:2
《计算机应用研究》2005年第7期78-80,共3页李成城 赵述芳 刘建毅 钟义信 
提出了一种对专有名词字串进行自动切分的方法,该方法对大量通用形式的专有名词进行统计分析,根据专有名词用字的出现位置和出现次数来分析,并把出现概率转换为估价值。则根据中文专有名词的特点,将中文专有名词的切分问题转换为决策树...
关键词:人工智能 自然语言处理 专有名词识别 动态规划 
歧义切分与专有名词识别软件被引量:4
《语言文字应用》2001年第3期9-15,共7页刘开瑛 
关键词:中文文本自动切词 中文信息处理 理论意义 应用价值 歧义字段切分 专有名词识别 识别软件 汉语 
检索报告 对象比较 聚类工具 使用帮助 返回顶部