未登录词

作品数:175被引量:1344H指数:18
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:黄德根周蕾史树敏许洪波朱巧明更多>>
相关机构:南京师范大学苏州大学中国科学院北京大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于深度学习的彝文分词系统设计与实现
《中国信息界》2024年第2期228-233,共6页王承先 
引言。分词作为自然语言处理(Natural Language Processing,NLP)中重要的基础性任务,已经广泛应用于信息检索[1]、文本分类[2]、机器翻译[3]、智能问答[4]等多个领域,并且分词任务的准确率直接影响着任务的性能[5]。按照技术划分为三大...
关键词:自然语言处理 文本分类 未登录词 信息检索 匹配规则 双向匹配 机器翻译 深度学习 
基于动态规划和流形排序的知识库问答未登录词处理
《计算机应用与软件》2023年第10期64-69,100,共7页何儒汉 万方名 胡新荣 刘军平 
国家自然科学基金项目(61170093)。
为解决知识库问答中较多实体未被纳入到词库中以及新词层出不穷旧词库无法及时更新的问题,提出一种基于动态规划和流形排序的知识库问答模型DPQA来为未登录词选择最优表征,缓解知识库未登录词描述信息不足的问题。该方法通过动态规划获...
关键词:知识库问答 动态规划 未登录词 流形排序 
融合词信息嵌入的注意力自适应命名实体识别被引量:5
《计算机工程与应用》2023年第8期167-174,共8页赵萍 窦全胜 唐焕玲 姜平 陈淑振 
国家自然科学基金(61976125,61976124)。
缺少分词信息及未登录词、无关词干扰是字符级中文命名实体识别面临的主要问题,提出了融合词信息嵌入的注意力自适应中文命名实体识别模型,在新词发现的基础上,将字向量嵌入与词级信息嵌入融合作为模型输入,减少了未登录词对模型的影响...
关键词:中文命名实体识别 注意力机制 动态缩放因子 未登录词 
细粒度语义知识图谱增强的中文OOV词嵌入学习被引量:2
《计算机科学》2023年第3期72-82,共11页陈姝睿 梁子然 饶洋辉 
国家自然科学基金面上项目(61972426)。
随着信息化领域的范围不断扩大,许多特定领域的文本语料开始涌现。这些特定领域,如医疗、通信等,由于受到安全性和敏感性的影响,其数据规模通常较小,传统的词嵌入学习模型难以获得有效的结果。另一方面,直接应用现有的预训练语言模型时...
关键词:未登录词嵌入学习 中文细粒度语义信息 细粒度知识图谱 图卷积网络学习 
《面向应用的汉语语义构词研究》简介
《现代语文》2023年第1期F0004-F0004,共1页
《面向应用的汉语语义构词研究》,由鲁东大学教授亢世勇等著,中国社会科学出版社2020年出版。汉语语义构词研究对于计算机语言信息处理未登录词语的识别、词汇教学、辞书编纂都具有重要的意义。该书系统介绍了面向计算机语言信息处理和...
关键词:语言信息处理 GB2312 未登录词 面向应用 信息库 语义分类 数据库 《同义词词林》 
基于用户交互状态感知的自动问答关键技术研究
《中国科技成果》2023年第2期28-28,共1页 徐戈 刘德建 陈威 朱虫虹 吴冬华 关胤 罗海波 杨晓燕 方荟 倪涵 
国家自然科学基金项目“中文情感资源自动构建的关键技术研究”(61300156);福建天晴数码有限公司、福州大学博士后研究项目“基于汉字语义的单词相似度计算”(184172);福州市校(院所)科技合作项目“智能问答系统关键技术研究”(2060404)。
项目以自动问答系统构建为总体研究任务,在语义相似度计算、注意力与情感检测、特定场景短文本对话优化等关键问题,开展相关创新研究. 1 项目主要研究内容 (1)分析了基于词典方法和向量嵌入方法的多种失效原因,提出了利用单词内部(汉字...
关键词:深度学习 语义相似度 文本对话 偏旁部首 自动问答 高频词 用户交互 未登录词 
面向未登录词及多义词的共现性词嵌入改进被引量:1
《计算机技术与发展》2022年第12期117-122,共6页李保珍 顾秀莲 
国家自然科学基金(71673122,72074117);江苏省社科基金项目(20WTB007);江苏省研究生科研创新项目(KYCX21_1948)。
基于语料库构建词语语义性向量的词嵌入模型,可以定量刻画词语的上下文语义。然而,传统的词嵌入模型在揭示一词多义词汇的语义时,存在着语义空间向量维度不确定或缺乏直观可解释性等局限,此外,对于词汇表外未登录新词语的语义性嵌入识别...
关键词:词嵌入 未登录词 多义词 共现矩阵 词向量 
针对中文分词的带标签注意力的成词记忆网络被引量:3
《计算机应用研究》2022年第6期1651-1655,共5页韩士洋 马致远 杨芳艳 李想 汪伟 
南京大学计算机软件新技术国家重点实验室开放课题项目(KFKT2021B39)。
成词信息是一种对中文分词任务十分重要的文本特征。最新中文分词模型之一的WMSEG就是通过引入成词信息来获得最顶尖的分词性能。然而这类模型在建模时并未考虑标签之间的依赖关系,导致其分词性能特别是对未登录词的识别有所欠缺。针对...
关键词:成词信息 中文分词 标签嵌入 注意力机制 未登录词 
藏文自动分词技术研究被引量:2
《中央民族大学学报(自然科学版)》2022年第2期63-66,共4页刘晓彤 赵小兵 
国家语委中心项目“多民族语言文本敏感信息监测与预警技术研究”(ZDI135-98)。
分词是自然语言处理的基础任务,本文针对藏文分词中的特殊问题及其研究成果进行了梳理,为今后学者开展该领域的相关研究提供参考和借鉴。重点阐述和分析了藏文自身语法带来的分词难点和藏文分词时的歧义和未登录词问题,并分析了目前藏...
关键词:藏文分词 语法 未登录词 歧义 
基于知识增强的中文命名实体识别被引量:12
《计算机工程》2021年第11期84-92,共9页胡新棒 于溆乔 李邵梅 张建朋 
国家自然科学基金青年基金(62002384);国家重点研发计划(2016QY03D0502);郑州市协同创新重大专项(162/32410218)。
基于字词联合的中文命名实体识别模型能够兼顾字符级别与词语级别的信息,但受未登录词影响较大且在小规模数据集上存在训练不充分等问题。在现有LR-CNN模型的基础上,提出一种结合知识增强的中文命名实体识别模型,采用相对位置编码的多...
关键词:中文命名实体识别 注意力机制 知识增强 未登录词 小规模数据集 
检索报告 对象比较 聚类工具 使用帮助 返回顶部