新词识别

作品数:53被引量:246H指数:8
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:毛文吉林俊杰熊新吴睿邵玉斌更多>>
相关机构:南京农业大学北京邮电大学平安科技(深圳)有限公司北京理工大学更多>>
相关期刊:《福州大学学报(自然科学版)》《中国科技博览》《黑龙江八一农垦大学学报》《电子元器件与信息技术》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金福建省教育厅科技项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于拼音相似度的中文谐音新词发现方法被引量:2
《计算机应用》2023年第9期2715-2720,共6页李瀚臣 张顺香 朱广丽 王腾科 
国家自然科学基金资助项目(62076006);安徽高校协同创新项目(GXXT-2021-008)。
新词识别作为自然语言处理的基础任务之一,为构建中文词典、分析词语情感倾向等提供了支持。然而,目前的新词识别方法没有考虑针对谐音新词的识别,导致谐音新词识别的准确率不高。为了解决这一问题,提出一种基于拼音相似度的中文谐音新...
关键词:谐音新词 新词识别 拼音相似度 平均互信息 邻接熵 
面向建筑领域的中文分词方法研究被引量:2
《电脑与信息技术》2021年第5期67-72,共6页李鹏 光永星 乔天玲 操峻岩 
中文分词技术目前存在的一个问题是针对特定领域未登录词识别效率较低的问题。建筑类文本分词由于受到专业本身词语的特点等限制,分词时对未登录词的识别效果不太好。提出一种非监督的基于改进算法与邻接熵结合的方法来进行未登录词的...
关键词:新词识别 互信息 中文分词 
基于互信息特征提取的食品安全信息新词识别被引量:2
《黑龙江八一农垦大学学报》2021年第2期73-79,共7页马强 路阳 李菲 
中国博士后科学基金面上项目(2016M591560);黑龙江省政府博士后资助经费(LBH-Z15185);黑龙江省博士后科研启动金资助项目(LBH-Q17134);黑龙江省自然科学基金重点项目(ZD2019F001);黑龙江省自然科学基金联合引导项目(LH2020F042);黑龙江八一农垦大学校内培育重点课题(XA2016-05)。
新词识别是食品安全信息处理中的一个难点,新词是造成分词错误的重要原因。利用互信息提取新词特征并采用BP神经网络过滤垃圾词串以识别新词,以提高食品安全文本分词准确率。首先在互信息新词识别基础上,得到候选新词的多个统计量特征...
关键词:互信息 食品安全信息 新词识别 BP神经网络 
混合语料的新词识别算法设计
《福建电脑》2021年第4期1-5,共5页余小燕 
福建省中青年教师教育科研资助项目(No.JAT170102)资助。
随着全球化趋势和国际交流的日益频繁,语言之间的渗透与融合日渐增加,不同语种夹杂的表达方式在生活中也相当普遍,特别是在使用双语或多语的地区。作为一个多民族融合的国家,我国各地的方言与普通话夹杂的表达方式也不在少数。这种语言...
关键词:混合语料 新词识别 互信息  
基于电力工单文本的WTF-IDF特征选择优化被引量:3
《电子设计工程》2021年第5期159-163,共5页朱君 杨萌 杜振东 章劲秋 嵇友浪 刘国婷 
国网江苏省电力有限公司科技项目(J2018020)。
文中通过对95598客服服务中心的电力工单历史数据中反映的热点问题进行建模,实现对海量工单文本内容快速、准确地分类,为管理人员发现与解决问题提供支撑。针对电力领域的特殊性,引入了通过新词识别手段构建的针对电力文本的领域词典。...
关键词:领域词典 新词识别 95598电力工单 WTF-IDF 
基于无监督方法的电力文本专业词汇识别研究被引量:1
《电力工程技术》2020年第6期159-165,共7页朱婷婷 杜一帆 李睿凡 熊永平 
国家电网有限公司总部科技项目(5200-201918255A-0-0-00)。
电力专业词汇识别是面向变电运检文档进行深入语言理解和知识图谱构建等智能应用的基础。领域无关识别方法的效果不能令人满意,为此文中根据电力领域词汇的语言学特征提出一种面向电力领域的无监督专业词汇发现方法。首先以通用词典对...
关键词:领域词典 无监督学习 新词识别 滑动窗口 统计特征 
中国英语新词语料库构建技术研究被引量:2
《计算机工程与应用》2020年第16期165-168,共4页刘永芳 郝晓燕 刘荣 
教育部人文社会科学研究基金(No.17YJA740031);山西省自然科学基金(No.201801D121137)。
随着中国英语新词大量出现,缺少中国英语新词语料库成为研究中国英语的主要障碍,新词识别是建设语料库主要的技术问题。针对现有的点互信息和邻接熵新词识别算法中的词内部凝聚度低,及点互信息单阈值设置存在较多高阈值无效词组,且低阈...
关键词:中国英语 中国英语新词语料库 新词识别 点互信息(PMI) 双阈值 
无监督分词算法在新词识别中的应用被引量:2
《小型微型计算机系统》2020年第4期888-892,共5页姜涛 陆阳 张洁 洪建 
安徽省教育厅重点项目(SK2018A0154)资助;国家重点研发计划专项项目(2016YFC0801804)资助。
新词识别过程中,使用分词工具进行预分词的方法,受限于训练语料而对某些领域的分词准确率不佳.针对这个问题,本文提出了一种改进方法.该方法首先基于元语言模型进行无监督预分词,再将词频、互信息和邻接熵作为主要特征进行新词发现.同...
关键词:新词识别 互信息 邻接熵 N元语言模型 中文分词 
现代汉语字知识库建设与动态新词识别
《语言文字应用》2019年第3期105-113,共9页唐兴全 
对外经济贸易大学中央高校基本科研业务费专项资金(项目号18YB23)资助
在对汉语文本进行理解处理时,对于连用的两个或多个字,关注点应为连用后的内容效应,即它们是否应作为一个整体的语义单位来理解。本文从汉语理解处理的角度出发,提出了动态新词的概念,介绍了动态词的描述角度,并给出了动态动词和动态名...
关键词: 知识库 动态新词 组合能力 句类知识 
融合知识图谱和ESA方法的网络新词识别被引量:2
《计算机技术与发展》2019年第3期12-17,共6页刘申凯 周霁婷 朱永华 高洪皓 
国家重点研发计划专项课题(2017YFD0400101)
随着互联网的高速发展,微博、微信等文本形式的使用量逐渐增多,对于这类文本的分析理解在自然语言处理领域形成了新的挑战,尤其是文本中的网络新词识别与语义理解方面。为了克服传统方法无法识别网络新词及其语义的缺点,提出了一种融合...
关键词:语义识别 语义相关度 新词识别 知识图谱 显性语义分析 
检索报告 对象比较 聚类工具 使用帮助 返回顶部