分词

作品数:5280被引量:7941H指数:43
导出分析报告
相关领域:自动化与计算机技术语言文字更多>>
相关作者:赵立军张霞康战辉孙茂松周国栋更多>>
相关机构:深圳市腾讯计算机系统有限公司平安科技(深圳)有限公司阿里巴巴集团控股有限公司北京百度网讯科技有限公司更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
核安全专业分词工具及语义库构建与应用研究
《科学技术创新》2025年第10期51-54,共4页杨舒茗 王晓东 张廉 朱胜 
本文针对核安全监管领域专业语料自然语言处理方面面临的中文分词不准确的挑战,提出一种核安全专业分词工具和语义库的构建方法,采用基于特征频率的自适应在线梯度下降方法进行高效中文分词,并利用Global Pointer模型结合条件随机场算法...
关键词:分词工具 语义库 中文分词 核安全监管 
基于改进SO-PMI算法的电力大数据词典构建方法
《信息技术与信息化》2025年第4期162-165,共4页隋石妍 董佳林 潘伟 
在大规模文本数据中,许多词汇对的共现情况非常稀少,导致PMI值的计算不稳定。传统SO-PMI算法在计算PMI值时,往往只考虑了词汇对在文本中的共现情况,而忽略了电力大数据特殊的语义关系和上下文关系,导致所计算的词间关联度不够精确,进而...
关键词:改进SO-PMI算法 电力领域 大数据 分词 词典构建 
基于预训练模型标记器重构的藏文分词系统
《计算机应用》2025年第4期1199-1204,共6页杨杰 尼玛扎西 仁青东主 祁晋东 才让东知 
新一代人工智能国家科技重大专项(2022ZD0116100);省部共建藏语智能信息处理及应用国家重点实验室开放课题项目(2023⁃Z⁃006)。
针对现有的预训练模型在藏文分词任务中表现不佳的问题,提出一种建立重构标记器规范约束文本,随后重构藏文预训练模型的标记器以进行藏文分词任务的方法。首先,对原始文本进行规范化操作,以解决因语言混用等导致的错误切分的问题;其次,...
关键词:藏语信息处理 藏文分词模型 预训练模型 自然语言处理 标记器重构 
面向应用设计的代码框架自动生成系统研究
《电脑编程技巧与维护》2025年第4期3-8,26,共7页靳飞飞 章继虎 季俊 葛贤亮 赵栋栋 周春鹏 
设计一种代码框架自动生成系统,基于编码器-解码器架构和中文分词技术,智能化地根据用户需求生成符合特定场景的代码框架。实验结果表明,该系统能快速生成符合预期的代码框架,有效缩短开发时间,提升开发效率和代码质量。
关键词:中文分词技术 代码框架自动生成 编码器-解码器架构 
大模型增强下知识库语义扩展智能识别方法
《计算机与数字工程》2025年第3期741-746,共6页何剑萍 徐胜超 贺敏伟 
国家自然科学基金面上项目(编号:61972444);广州华商学院校内科研导师制项目(编号:2023HSDS26)资助。
为提升智能系统的处理能力和准确性,提出大模型增强下知识库语义扩展智能识别方法。将连续的文本切分成一系列独立的基本词汇,计算词汇的相似度,选出其中的关键词。针对关键词,利用本体扩展算法进行语义扩展。利用自注意力机制的深度学...
关键词:大模型增强 分词 关键词提取 知识库语义扩展 智能识别 
基于改进隐马尔可夫模型的藏文分词研究
《信息技术与信息化》2025年第3期64-67,共4页贡保加 安见才让 
青海民族大学2023年度校级本硕博(学生)项目“基于深度学习的脱机手写藏文识别研究”(09M2023004)。
藏文分词是藏语信息处理领域的基础课题,分词是将原始文本数据切分成词的一种技术。分词技术可以应用到自然语言处理领域的许多下游任务中,诸如机器翻译、语义标注、文本分类、自然语言推理等,分词是自然语言处理中极为关键的环节。文...
关键词:藏文分词 隐马尔可夫模型 分词算法 未登录词 
基于大语言模型命名实体识别的AI智能问答优化
《邮电设计技术》2025年第3期80-84,共5页施志雄 段该甲 马龙轩 吴婕 
为优化AI问答效果,提出基于大语言模型命名实体识别的优化方法。首先,通过在多种分割方式中选取最优方案,结合词语划分概率判断结果,对语料库文本进行分词。其次,在预训练的BERT模型顶部添加线性层,并通过标注数据对预测实体类别进行微...
关键词:大语言模型 BERT 命名实体识别 智能问答 分词 
基于Elasticsearch的气象数据搜索系统设计与实现
《电脑知识与技术》2025年第4期103-106,共4页尹常红 杨维发 胡雅超 袁文波 
武汉城市圈气象联合科技创新基金项目(WHCSQY202314)。
随着气象科技的快速发展,气象数据显著增加。传统关系型数据库在处理海量气象数据时,面临搜索效率不高和查询灵活性不足等问题,这限制了气象数据的应用服务水平。针对海量数据高效便捷的搜索需求,本文设计并开发了一种基于Elasticsearc...
关键词:Elasticsearch 分词器 气象数据 数据搜索 对象存储 
基于CNN与Transformer混合模型的肺炎辅助诊断
《计算机系统应用》2025年第2期216-224,共9页贠恺 贾荣浩 魏国辉 赵爽 李学辉 马志庆 
国家自然科学基金(61702087);山东省研究生教育质量提升计划(SDYJG1943);山东中医药大学科学研究基金(KYZK2024Q30)。
肺炎是一种常见的呼吸系统疾病,早期诊断对于有效治疗至关重要.本研究提出了卷积神经网络(CNN)和Transformer结合的CTFNet混合模型,旨在实现高效而准确的肺炎辅助诊断.该模型融合了卷积分词器和聚焦线性注意力机制.卷积分词器通过卷积...
关键词:肺炎图像分类 卷积神经网络 TRANSFORMER 卷积分词器 聚焦线性注意力机制 
基于中医疫病古籍文本自动分词的药物规律挖掘研究
《现代情报》2025年第2期17-25,159,共10页刘嘉宇 李贺 于琳 时倩如 侯力铁 
国家社会科学基金冷门绝学专项研究项目“本草典籍整理、知识组织与智慧化建设研究”(项目编号:23VJXT024)。
[目的/意义]数字人文背景下的中医疫病古籍文本自动分词和基于分词结果的药物规律挖掘,是促进古籍知识活化与支持临床诊疗的重要途径。[方法/过程]本文提出了一种基于中医疫病古籍文本自动分词的药物规律挖掘框架,该框架包含了数据获取...
关键词:数字人文 文本分词 BiLSTM-CRF 中医疫病 知识挖掘 
检索报告 对象比较 聚类工具 使用帮助 返回顶部