汉语自动分词系统

作品数:12被引量:173H指数:5
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:刘挺吴岩姚天顺张桂平周长胜更多>>
相关机构:哈尔滨工业大学东北大学清华大学北京机械工业学校更多>>
相关期刊:《许昌学院学报》《信息与电脑(理论版)》《河南大学学报(自然科学版)》《中文信息学报》更多>>
相关基金:河南省科技攻关计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于C程序实现汉语自动分词系统
《信息与电脑(理论版)》2012年第9期119-120,共2页郭俊凤 岳金萍 王开铸 
统计汉字文本文件的字、词、句的数目,是汉字文本统计的基本课题之一,本文基于C程序重点实现汉语自动分词系统。
关键词:汉语自动分词系统 正向最大匹配 逆向最大匹配 
汉语分词技术综述被引量:26
《北京机械工业学院学报》2004年第3期52-55,61,共5页龚汉明 周长胜 
分词是中文信息处理的基础,在汉语文本分类、文献标引、智能检索、自然语言理解与处理等应用中,首先都要对中文文本进行分词处理。从分词的基本理论出发,对近年来的汉语分词的研究方法与成果进行了综合论述,分析了现有分词方法的特点,...
关键词:汉语分词 中文文本 分词方法 汉语自动分词系统 汉语文本 自然语言理解 技术综述 文献标引 智能检索 成果 
HENU汉语自动分词系统中歧义字段消除算法被引量:5
《河南大学学报(自然科学版)》2004年第4期49-52,共4页郑逢斌 付征叶 乔保军 毋琳 
河南省科技厅科技攻关项目(0424220146)
先用基于词典的最大匹配法匹配出最长词和次长词,再用检测跨越的方法发现切分歧义,判断出切分歧义是交集型切分歧义还是组合型切分歧义,根据切分歧义类型的不同分别进行切分歧义的消除.交集型切分歧义的消除方法主要是混合使用基于规则...
关键词:自然语言处理 自动分词 歧义字段 
汉语自动分词系统中切分歧义与未登录词的处理策略被引量:3
《青海师范大学学报(自然科学版)》2004年第2期31-34,共4页韩维良 
本文主要综述了汉语自动分词系统中,切分歧义与未登录词的表现形式以及相应的处理策略,指出在没有完全突破现行机器翻译理论的前提下,增强机器翻译系统中切分歧义与未登录词的处理能力,是提高系统准确率的一种有效措施。
关键词:机器翻译 自动分词 切分歧义 未登录诃 策略 
汉语自动分词系统设计
《黑龙江科技信息》2004年第10期39-39,共1页马东坡 
介绍了应用高级程序没计语言标准 C++,对应用于中文搜索引擎的汉语自动分词系统设计方法进行了论述。
关键词:汉语自动分词系统 C++ 中文搜索引擎 语言标准 系统设计方法 程序 对应 
汉语自动分词系统的评价被引量:1
《微处理机》2003年第5期28-30,共3页王彩荣 李晓毅 黄玉基 
汉语自动分词是中文信息处理中最基本的工作。近年来 ,已有多种自动分词软件问世 ,但尚无评价此类软件的标准、模型和方法。本文针对自动分词软件的特点 ,提出了自动分词软件的评价准则 ,并给出了定性和定量的度量方法。
关键词:中文信息处理 汉语自动分词系统 自然语言理解 评价 
中文文本中公司名简称的识别被引量:3
《许昌学院学报》2003年第2期99-101,共3页张占英 王中立 
对中文文本的公司名简称的识别提出了一种有效的识别方法 ,即在公司名第一次出现时要充分利用其给出的定义信息 ,作为以后识别此公司名的简称的基础 .经封闭测试 ,系统对公司名简称的识别准确率为98 2 % ,召回率为 93 4% .
关键词:文字识别 汉语自动分词系统 中文文本 公司名简称 歧义处理 识别规则 
串频统计和词形匹配相结合的汉语自动分词系统被引量:65
《中文信息学报》1998年第1期17-25,共9页刘挺 吴岩 王开铸 
本文介绍了一种汉语自动分词软件系统,该系统对原文进行三遍扫描:第一遍,利用切分标记将文本切分成汉字短串的序列;第二遍,根据各短串的每个子串在上下文中的频度计算其权值,权值大的子串视为候选词;第三遍,利用候选词集和一部...
关键词:中文信息处理 自动分词 汉语 串频统计 词形匹配 
基于神经网络的汉语自动分词系统的设计与分析被引量:30
《情报学报》1998年第1期41-50,共10页尹锋 
应用神经网络进行汉语自动分词研究是中文信息处理领域的重要课题。本文从分析神经网络的一个主要模型和算法入手,阐述了基于神经网络的汉语自动分词系统的设计方法,较详细地介绍了该系统的实验结果,并给出了必要的分析。
关键词:神经网络 汉语分词 分词系统 设计 
基于知识评价的快速汉语自动分词系统被引量:4
《情报学报》1996年第2期95-105,共11页张民 李生 王海峰 赵铁军 王铁志 
汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个,一个是切分的速度,一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法,可大大提高系统的切分速度,而且利用基于复杂特征集的规则、模式...
关键词:汉语自动分词 歧义 平价函数 词规则 信息处理 
检索报告 对象比较 聚类工具 使用帮助 返回顶部