分词词典

作品数:52被引量:308H指数:8
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:张培颖李村合周长胜杨娜丁维更多>>
相关机构:百度在线网络技术(北京)有限公司清华大学中国石油大学(华东)北京邮电大学更多>>
相关期刊:《软件》《计算机应用》《泰山学院学报》《计算机技术与发展》更多>>
相关基金:国家高技术研究发展计划国家自然科学基金国家重点基础研究发展计划国家重点实验室开放基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于CPA《会计》教材的会计领域分词词典构建
《河南财经学刊》2024年第5期18-24,共7页韩俊杰 
重庆市教育委员会科学技术研究计划青年项目资助项目(KJQN202303916);重庆市教育科学规划课题教改专项:基于RPA技术的高职院校会计专业人机协作技能培养研究(K23ZG3160193)。
中文分词是会计领域文本研究的一项基本任务,在会计文本形式特征研究中发挥着重要作用。会计领域文本分词面临的一个挑战是缺乏符合会计领域用语习惯的分词词典,尤其是面向术语、常用语等领域特色的分词词典。为对会计领域的文本数据进...
关键词:会计 分词词典 CPA会计考试教材 
基于统计方法从文本中抽取分词词典被引量:2
《电脑知识与技术》2020年第4期213-214,共2页黄超 
国家重点研发计划(2017YFB0802300)资助.
常见的机器翻译方法有两种,一种是已经发展得比较完善的统计机器翻译,另一种是出现不久的神经机器翻译。这两种翻译方式首先都需要将文本划分成词或短语,对于一些语种,如中文,词并不是明显分开的,必须要分词。分词的时候,需要使用词典,...
关键词:机器翻译 分词 词典 
越南语分词词典半监督集成构建算法
《郑州大学学报(理学版)》2018年第1期60-65,共6页刘伍颖 王琳 
国家语委重点项目(ZDI135-26);广东省高校特色创新项目(2015KTSCX035);广东省哲学社会科学重点实验室招标项目(LEC2017WTKT002)
针对越南语分词词典构建问题,提出了一种新的半监督集成构建方法.该方法能够结合人工干预,从大规模未标注越南语语料中识别多音节单词.首先设计了一种n元音节词产生器,并生成尽可能多的候选多音节词;其次通过3种统计特征的计算并根据预...
关键词:半监督集成构建 分词词典 多音节词 n元音节词 越南语 
汉语词汇分词研究——隐性分词词典在信息检索中的应用
《商》2015年第34期291-292,共2页张慧芳 
北方民族大学2014年区级大学生创新项目(项目编号QJCX-2014-001);北方民族大学2014年研究生创新院级项目;北方民族大学2015年研究生创新项目校级项目(项目编号YCX1507)
汉语分词是从动态的信息中检索出符合用户个性化需求的词汇理论,它能为用户提供及时、个性化的信息服务。笔者探讨了汉语词汇分词在网络信息检索中的应用,提出隐式分词词典,该词典在汉语文本输入的同时进行分词联想,更好的解决了中文信...
关键词:汉语 分词 检索 隐性词典 
基于MMSeg分词的多部主题词表联合标注研究与实现
《绍兴文理学院学报》2015年第7期39-44,共6页陈晓燕 
为了解决多部主题词表联合标注中标注词条数量大、子串较多等问题,本文提出了基于MMSeg分词的标注方法.采用MMSeg分词算法将待标注文本先切分形成词串再进行标注,并改进了分词词典从而支持子串的标注,保证了较高的召回率.还就相关内容...
关键词:分词词典 MMSeg算法 标注 消歧 主题词表 
旅游网络评论情感分析方法研究及系统实现被引量:5
《深圳信息职业技术学院学报》2015年第3期57-62,共6页覃国蓉 叶志成 庄槟豪 蔡哲聪 
深圳信息学院校级科研培育项目(编号:LG201433);广东省教育科研"十一五规划项目(编号:2010TJK410)资助
本文针对旅游领域,展开网络评论情感分析方法研究并为航空公司、酒店用户实现了一个实用的旅游网络评论监控系统。设计了简捷方便的情感分析方法,基于情感词典对旅游网络评论进行情感分析,针对旅游领域优化分词词典和情感词典,以获得较...
关键词:旅游网络评论 情感分析 情感词典 分词词典 网络评论监控 
基于Hash结构词典的双向最大匹配分词法被引量:18
《计算机科学》2015年第B11期49-54,共6页陈之彦 李晓杰 朱淑华 付丹龙 邢诒海 
国家自然科学基金(61272415;61272067);国家863计划重大项目(2013AA01A212);广东省自然基金团队研究项目(S2012030006242);广州市重点实验室开放基金(2012-224)资助
针对当前自然语言处理中中文分词基于词典的机械分词方法,正序词典不能作为逆向最大匹配分词词典以及反序词典维护困难的问题,提出一种新的词典构造方法并设计了相应的双向最大匹配算法,同时在算法中加入了互信息歧义处理模块来处理分...
关键词:分词词典 双向最大匹配法 基于Hash的单字索引 互信息歧义处理 
基于农业垂直搜索引擎中文分词词典的构建研究被引量:3
《广东农业科学》2015年第3期165-169,共5页张启宇 于辉辉 陈英义 王磊 
山东省自主创新专项(2012CX90204)
在农业垂直搜索引擎研究过程中,中文分词是重要的研究方向。针对传统农业垂直搜索引擎搜索信息抽取不准确、速度慢等缺点,采用双数组Trie树为基本模型,利用中文词条首字区位码与数据库表行号相对应的方式,并根据农业垂直搜索引擎的需要...
关键词:中文分词 农业词典 MY SQL 词性编码 
基于HMM的柯尔克孜语词性标注的研究被引量:1
《计算机工程与应用》2014年第15期120-124,共5页陈莉 古丽拉.阿东别克 
国家自然科学基金(No.61063025)
柯尔克孜语的语言信息处理研究,对新疆柯尔克孜族是否能跨入信息时代,传承民族文化起着至关重要的作用。采用两级标注法,基于传统的HMM理论,改进了HMM模型参数的计算、数据平滑和未登入词的处理方法,更好地体现了上下文依赖关系。同时,...
关键词:柯尔克孜语 自动分词词典 隐马尔可夫模型(HMM) 词性标注 
基于双数组Trie树的中文分词词典算法优化研究被引量:8
《计算机工程与科学》2013年第9期127-131,共5页杨文川 刘健 于淼 
北大方正集团有限公司数字出版技术国家重点实验室开放课题资助项目(2012072011)
基于双数组Trie树的中文分词词典具有较高的查找效率,但其插入时间复杂度较高。为此提出了一种基于双数组Trie树结构的改进算法iDAT,在原始词典初始化时优先处理分支多的节点,并在初始化之后对base数组中的空序列的下标值做Hash,Hash表...
关键词:双数组 TRIE树 时间复杂度 分词词典 
检索报告 对象比较 聚类工具 使用帮助 返回顶部