汉语自动分词

作品数:141被引量:1125H指数:23
导出分析报告
相关领域:自动化与计算机技术文化科学更多>>
相关作者:孙茂松尹锋邹嘉彦黄德根黄昌宁更多>>
相关机构:清华大学大连理工大学哈尔滨工业大学湖南大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
《图书情报工作》2020年第7期3-3,共1页何琳 
中华文明五千年来一脉相承、从未中断,其中一个重要的原因就是中华民族拥有各个历史时期的、浩如烟海的典籍。典籍的整理、归纳、描述、分析和挖掘是传播、继承和发扬中华优秀传统文化的重要途径,对于保护传承文化遗产以及深入阐发文化...
关键词:中华优秀传统文化 数字人文 自然语言处理 知识抽取 机器学习 汉语自动分词 保护传承 智能化信息处理 
基于语料库的汉语自动分词错误类型分析被引量:1
《华中师范大学研究生学报》2017年第1期93-97,共5页张莉莉 冯燕 
华中师范大学研究生教育创新资助项目"庭审互动的多模态话语立场研究"(项目批准号:2016CXZZ189)阶段性成果
运用CIPP对68908字的庭审会话语料库进行自动分词处理,并参照《现代汉语词典》(第7版)及《信息处理用现代汉语分词规范》(GB/T 13715-92)对分词结果进行人工校对及错误类型分析。研究发现,除了未登录词、交集型歧义和包孕型歧义外,还存...
关键词:庭审会话 自动分词 错误类型 分词规范 
汉语自动分词系统的设计与实现
《信息与电脑(理论版)》2014年第7期166-168,共3页袁琳琳 陈红平 
贵阳市科技局高层次创新型青年科技人才项目(筑科合同[2012HK]209-24号);贵阳国家高新技术产业开发区管理委员会科技型中小企业技术创新基金(GXCX2013-006)
基于.NET技术,采用改进的增字最大匹配算法3、"退一字组合法"5、自定义规则和Lucene.Net技术实现了汉语自动分词系统。实验证明系统在保证歧义、人名、数字、邮箱识别等方面的切分精度的同时,还保证了较高的切分效率。文章介绍了汉语中...
关键词:汉语自动分词 分词算法 字串 歧义现象 匹配算法 组合法 分词方法 增字 匹配法 中文信息处理 
汉语自动分词词典新机制—词值哈希机制被引量:1
《计算机系统应用》2013年第2期233-235,共3页韩莹 王茂发 陈新房 潘志安 张艳霞 
汉语词典查询是中文信息处理系统的重要基础部分,对系统效率有重要的影响.国内自80年代中后期就开展了中文分词词典机制的研究,为了提高现有基于词典的分词机制的查询效率,对于词长不超过4字的词提出了一种全新的分词词典机制——基于...
关键词:中文信息处理 中文分词 词典机制 2000进制 拉链式词值哈希机制 
基于C程序实现汉语自动分词系统
《信息与电脑(理论版)》2012年第9期119-120,共2页郭俊凤 岳金萍 王开铸 
统计汉字文本文件的字、词、句的数目,是汉字文本统计的基本课题之一,本文基于C程序重点实现汉语自动分词系统。
关键词:汉语自动分词系统 正向最大匹配 逆向最大匹配 
1984—2011年中国自动分词研究综述
《农业图书情报学刊》2012年第6期140-143,共4页张丽媛 
以中国期刊全文数据库(CNKI)中收录的有关自动分词文献为研究对象,从发表时间,期刊发文量,研究主题和研究者来源等方面,对中国的自动分词研究。总结1984年-2011年,自动分词研究呈现出的特点和发展趋势。
关键词:自动分词:汉语自动分词:统计分析 
浅谈汉语自动分词的几种方法
《价值工程》2011年第13期176-177,共2页王希杰 赵晓凡 
汉语自动分词是计算机中文信息处理系统的基础和难题,本文对近年来的汉语自动分词的方法如机械匹配法、特征词库法等进行了分析。在此基础上指出:要使汉语自动分词问题得到圆满的解决,就必须深入研究汉语的词法、语法、语义甚至语用和...
关键词:汉语自动分词 词库 分词算法 
基于统计和规则的中文姓名识别
《信息与电脑(理论版)》2011年第5期28-29,共2页赵伟 张学 安诚 
本文基于统计和规则提出一种中文识别方法。利用统计信息得到候选中文姓名,而后利用姓名前后的指界词、称谓词等相关信息从候选中文姓名中进行筛选,完成识别。实验表明该方法的正确率和召回率比较高,并且由于中文姓名在未登录词中占有...
关键词:汉语自动分词 未登录词识别 中文姓名识别 统计和规则 
电子商务领域本体知识库的构建及应用被引量:3
《计算机系统应用》2010年第11期38-42,共5页王志强 任燕 郭宁 傅向华 
广东省自然科学基金项目(07301329);深圳市科技计划资助项目(200741)
本文利用本体丰富的语义知识和语法结构及其共享性,构建了电子商务领域的本体知识库,用于解决数据的结构异构和语义异构问题。同时开发了面向电子商务领域本体知识库的汉语自动分词系统。结果表明,引入本体知识库能在一定程度上提高词...
关键词:本体 领域本体知识库 汉语自动分词 
汉语自动分词理论对英语教学的启示
《榆林学院学报》2010年第1期104-106,共3页陈湘柳 
计算语言学是从语言学中分离开来的学科交叉的门类。汉语自动分词是计算语言学中的一个热门研究方向,研究发现,汉语自动分词的语料库、最大匹配法、分词规范、歧义问题、未登录词等理论知识对英语教学有很好的启发作用。
关键词:语言学 计算语言学 汉语自动分词 英语教学 
检索报告 对象比较 聚类工具 使用帮助 返回顶部