分词系统

作品数:69被引量:616H指数:13
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:孙茂松宋柔赵小兵陈家骏李卫亮更多>>
相关机构:华南理工大学清华大学北京工业大学北京神州泰岳软件股份有限公司更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金北京市自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于预训练模型标记器重构的藏文分词系统
《计算机应用》2025年第4期1199-1204,共6页杨杰 尼玛扎西 仁青东主 祁晋东 才让东知 
新一代人工智能国家科技重大专项(2022ZD0116100);省部共建藏语智能信息处理及应用国家重点实验室开放课题项目(2023⁃Z⁃006)。
针对现有的预训练模型在藏文分词任务中表现不佳的问题,提出一种建立重构标记器规范约束文本,随后重构藏文预训练模型的标记器以进行藏文分词任务的方法。首先,对原始文本进行规范化操作,以解决因语言混用等导致的错误切分的问题;其次,...
关键词:藏语信息处理 藏文分词模型 预训练模型 自然语言处理 标记器重构 
基于深度学习的彝文分词系统设计与实现
《中国信息界》2024年第2期228-233,共6页王承先 
引言。分词作为自然语言处理(Natural Language Processing,NLP)中重要的基础性任务,已经广泛应用于信息检索[1]、文本分类[2]、机器翻译[3]、智能问答[4]等多个领域,并且分词任务的准确率直接影响着任务的性能[5]。按照技术划分为三大...
关键词:自然语言处理 文本分类 未登录词 信息检索 匹配规则 双向匹配 机器翻译 深度学习 
基于长短时神经网络的古汉语分词系统被引量:1
《自动化与仪器仪表》2020年第2期128-131,共4页高毅 
在自然语言处理领域,分词是非拉丁语系语言处理的首要任务。而在中文自然语言处理中,常见的是针对现代汉语进行分词处理,对古汉语涉及得较少。针对这一问题,设计针对古汉语的分词系统。系统采用流行的深度学习方法,对中文首先进行分词,...
关键词:自然语言处理 深度学习 中文分词 长短时神经网络 
基于复杂网络的大型互联网企业高管分析
《上海理工大学学报》2019年第5期461-468,共8页郑喜亮 苏湛 艾均 
采用复杂网络分析特定属性群体。以互联网企业高管简历作为原始数据,以高管姓名和分词系统抽取实体关键词作为节点,个人简历中是否包含关键词作为连接边的条件进行建模,使用复杂网络理论对所建网络进行分析。实验结果表明,部分关键词节...
关键词:复杂网络 分词系统 中心性 
中文分词中歧义字段处理的研究被引量:3
《电子世界》2019年第12期54-55,共2页方玉萍 万荣 方达 
云南省教育科学规划教师教育专项课题(立项编号:GJZ1418)
歧义字段是中文分词中的难点,它往往会消弱分词的精准率和召回率。而遗传算法是基于“优胜劣汰”的方式寻优的,用来处理歧义字段在中文分词系统正符合其思路。实验结果得出,在分词中的召回率和综合率都高出传统的歧义消除方法。中文分...
关键词:中文分词系统 歧义字段 遗传算法 歧义消除 召回率 寻优 
基于互信息改进算法的新词发现对中文分词系统改进被引量:1
《电子元器件与信息技术》2018年第9期11-13,20,共4页夏同飞 李志 王超 郭振 张学敏 费晓璐 
近几年,伴随着经济的发展和社会的进步,配电网在电网企业中发挥的作用在不断增大,基于此,要对营配台账予以重视。文章中主要是借助自然语言处理(NLP)中文分词、模型匹配等技术对相关问题进行分析,依据各个地区以及不同系统设备台账的命...
关键词:互信息 改进算法 新词识别 中文分词系统 Trie索引树 
中文分词技术综述被引量:11
《现代计算机》2018年第23期17-20,共4页冯俐 
南充市哲学社会科学研究规划项目(No.NC2016C073)
通过对CNKI检索得到的关于中文分词的文献进行统计和分析,发现逐年度研究发文情况,研究的项目支持情况,发文机构分布和研究主题等统计结果,综述关于中文分词的算法、歧义词、未登录词和分词系统的相关研究内容,总结统计文献表现出的研...
关键词:中文分词 歧义词 未登录词 分词系统 
基于K近邻分类算法的涉恐信息过滤模型研究被引量:13
《情报杂志》2018年第3期64-70,共7页唐华 杨解君 王俊 黄炜 
湖北省教育厅人文社会科学研究青年项目"风险管理视角下的信息安全"(编号:15Q065);国家自然科学基金项目"微博环境下实时主动感知网络舆情事件的多核方法研究"(编号:71303075)研究成果之一
[目的/意义]针对现有的涉恐信息过滤在语义过滤和主题无关性方面还存在一定的不足,建立了基于K近邻分类算法的涉恐信息过滤模型。[方法/过程]通过采用K近邻分类算法、TF-IDF分词系统和语义相似度计算建立了一种新的涉恐信息过滤模型,并...
关键词:涉恐信息 信息过滤 K近邻算法 分词系统 语义相似度 
藏文自动分词系统中虚词识别算法研究被引量:8
《计算机应用与软件》2017年第9期299-301,333,共4页拉巴顿珠 欧珠 赵栋材 
2015年度西藏大学研究生高水平人才培养项目;2016年教育部人文社会科学研究项目(16XZJCZH001);2016年西藏自治区自然科学基金项目(2016ZR-15-5)
在分析现有藏文自动分词方法的基础上,针对藏文分词系统中虚词识别的难点进行深入研究。根据传统藏文文法,描述了藏文虚词在文本中不同的表现形式,用规则和统计相结合的方法,建立了较为全面的虚词知识库和规则库,并给出切分用虚词分块算...
关键词:藏文自动分词 藏文信息处理 虚词识别 藏文虚词 
基于SQL Server的中文分词系统设计及应用被引量:2
《电子设计工程》2016年第17期39-41,共3页张昭楠 马亚蕾 
随着当前信息化技术的发展,优化设计中文分析系统已成为必然趋势,有助于提升网络索引擎面对中文信息的检索能力,本篇中将分析基于SQL Server的中文分词系统设计需求,从而优化设计中文分词系统,结合实际应用分析设计该系统的应用效益。...
关键词:中文分词系统 分词系统 SQL SERVER 设计 
检索报告 对象比较 聚类工具 使用帮助 返回顶部