歧义切分

作品数:24被引量:197H指数:8
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:孙茂松刘开瑛罗智勇张永奎温滔更多>>
相关机构:苏州大学山西大学华中师范大学北京理工大学更多>>
相关期刊:《苏州大学学报(工科版)》《计算机研究与发展》《韩山师范学院学报》《计算机工程》更多>>
相关基金:国家自然科学基金国家社会科学基金教育部人文社会科学重点研究基地度重大研究项目教育部科学技术研究重点项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于改进Trie树的歧义消解方法被引量:1
《计算机与数字工程》2020年第9期2238-2243,共6页陈倩 乐红兵 
词典是汉语自动分词的基础,减少交集型歧义可以提高分词的准确率。在基于词典切分中,传统的Trie树每个节点存储一个字符,构建时产生了很多空指针。为了优化词典存储结构,在Trie树的基础上,采用双字Hash机制:把Trie索引树的深度限制为2,...
关键词:词典 自动分词 歧义切分 TRIE树 双字Hash存储 词频 词性 
浅析中文分词方法被引量:2
《漳州职业技术学院学报》2016年第3期45-48,共4页沈静 
中文分词是中文文本挖掘和信息处理的基础环节,而中文文本挖掘首先面临的是中文的分词问题。中文分词的方法主要有基于字符串匹配的分词方法、基于统计的分词方法和基于理解的分词方法三种,第一种分词方法简单、快捷,但对词典的完备性...
关键词:中文分词 文本挖掘 歧义切分 
基于汉语拼音首字母索引的混合分词算法被引量:2
《计算机系统应用》2016年第4期221-225,共5页杨进才 陈忠忠 谢芳 胡金柱 
教育部社科基金(13YJAZH117);国家社科基金(14BYY093)
中文自动分词是web文本挖掘以及其它中文信息处理应用领域的基础.蓬勃发展的中文信息处理应用对分词技术提出了更高的要求.提出了一种新的分词算法FPLS,该算法用拼音首字母作为词语表一级索引,词语的字数为二级索引构造分词词典,采用双...
关键词:中文分词 拼音索引 双向匹配 歧义切分 
中文分词算法综述被引量:8
《黑龙江科技信息》2012年第8期206-206,共1页张丹 
牡丹江师范学院校级科研项目;KY200903
中文分词是中文信息处理的关键技术之一,本文对多种中文分词算法、自动分词理论模型进行了详细的阐述和讨论,为中文分词的进一步发展提供基础和方向。
关键词:中文分词 算法 歧义切分 
中文分词技术在交通管理系统中的应用研究被引量:1
《科技资讯》2010年第7期253-254,共2页李娜 
如何建立适于交通管理系统下信息检索子系统中的分词模块是提高检索性能的关键所在。本文在分析交通管理领域特点的基础上,提出了适合交通管理领域的分词方法,实现了适用于该领域内的分词系统。实验结果表明,系统测试的准确率和召回率...
关键词:中文分词 歧义切分 N最优路径 人名识别 地名识别 
汉语文本自动分词算法的研究被引量:12
《计算机工程与应用》2010年第3期125-127,130,共4页何国斌 赵晶璐 
发展基金资助项目(WEB信息智能获取算法的研究;西南大学计算机与信息学院)
分析了中文分词词典的机制,提出了一种改进的整词分词字典结构,并针对机械分词算法的特点,将其与概率算法相结合,探讨了一种中文自动分词概率算法。采用哈希及二分法对词典进行分词匹配。实验表明,该算法具有较高的分词效率和准确率,对...
关键词:自动分词 分词算法 字典 歧义切分 
多种方法融合的中文自动分词系统的设计与实现
《韩山师范学院学报》2009年第6期37-43,共7页郑炜冬 
韩山师范学院青年科学基金项目(韩科字[2006]02号)资助
在分析现有几种中文自动分词算法的优劣且能实现优势互补的基础上,提出一种多种方法融合的中文自动分词算法.利用Visual-Prolog开发基于该算法的自动分词系统,并探讨了开发过程的关键技术.实验表明,采用所述算法和技术的自动分词系统的...
关键词:中文自动分词 最大匹配法 歧义切分 未登录词 分词词典 Visual-Prolog 
中文分词算法概述被引量:39
《电脑知识与技术》2009年第4期2605-2607,共3页龙树全 赵正文 唐华 
当前搜索引擎技术被广泛地应用,这使得全文检索技术和中文分词技术的研究逐渐深入.中文分词是中文信息的关键技术之一.其质量高低直接影响中文信息处理效率。文章致力于研究中文分词算法,对多种中文分词算法、自动分词系统的理论模...
关键词:中文分词 全文检索 算法 搜索引擎 歧义切分 
中文分词中歧义切分处理策略被引量:10
《山西大学学报(自然科学版)》2007年第2期163-167,共5页郑家恒 张剑锋 谭红叶 
国家自然科学基金(60473139);山西省自然科学基金(20051034)
文章试图从歧义字段本身的特点,即从伪歧义与真歧义这两个角度,以规则库为辅助手段,构建相应概率统计模型来解决歧义字段切分的问题.概率模型中特征的选取考虑了相邻词语和相邻词语的语义信息.实验表明该模型在解决歧义切分问题上是有效的.
关键词:自动分词 伪歧义 真歧义 概率模型 
一种基于多元信息库的自适应汉语歧义切分方法被引量:1
《小型微型计算机系统》2006年第8期1597-1600,共4页朱巧明 温滔 李培蜂 钱培德 
江苏省高技术研究项目(BG2005020)资助;江苏省自然基金项目(BK2003030)资助;江苏省教育厅自然(04KKB320134)资助
在分析目前分词方法的基础上提出了一种通过建立多元信息库、采用改进型的粗分算法以找出所有可能存在歧义的句子、借助于人工干预建立错误切分歧异词库等,实现汉语歧异切分的方法,通过修改、插入多元信息库中的信息量,进一步设计了一...
关键词:多元信息库 歧义切分 自适应 
检索报告 对象比较 聚类工具 使用帮助 返回顶部