许云

作品数:8被引量:158H指数:5
导出分析报告
供职机构:北京理工大学更多>>
发文主题:自然语言处理知网相关度计算语义相关度语义更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机工程与应用》《北京理工大学学报》《计算机应用研究》《计算机工程》更多>>
所获基金:云南省电子信息产业发展基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-8
视图:
排序:
基于《知网》信息结构模式的词汇化树邻接文法消歧被引量:1
《计算机工程》2005年第13期4-6,共3页许云 樊孝忠 张锋 
针对词汇化树邻接文法的歧义现象,利用《知网—信息结构库》作为知识库,并引入概率方法提出了一种有效的句法树消歧方法。文中阐述了如何利用知网信息结构模式对句法树进行筛选,并提出了基于概率的信息结构抽取的计算方法。
关键词:词汇化树邻接文法 消歧 知网 信息结构模式 
一种不需分词的中文文本分类方法被引量:5
《北京理工大学学报》2005年第9期778-781,共4页许云 樊孝忠 张锋 
云南省信息技术基金资助项目(2002IT03)
提出了一种不需分词的n元语法文本分类方法.与传统文本分类模型相比,该方法在字的级别上利用了n元语法模型,文本分类时无需进行分词,并且避免了可能造成有用信息丢失的特征选择过程.由于字的数量远小于词的数量,所以该分类方法与其它在...
关键词:文本分类 分词 n元语法模型 
基于知网的语义相关度计算被引量:53
《北京理工大学学报》2005年第5期411-414,共4页许云 樊孝忠 张锋 
云南省信息技术基金资助项目(2002IT03)
为解决句法分析中的结构性歧义,引入了语义相关度计算.基于语义相似度计算及知网的语义信息,提出了语义相关度计算方法;利用知网的义原纵向与横向关系及实例信息计算不同词性的相关度.在计算义原距离时,考虑了义原之间的解释关系,对义...
关键词:语义相关度 知网 自然语言处理 
基于互信息的中文术语抽取系统被引量:36
《计算机应用研究》2005年第5期72-73,77,共3页张锋 许云 侯艳 樊孝忠 
介绍了一个中文术语自动抽取系统,该系统首先基于互信息计算字串的内部结合强度,从而得到术语候选集;接着从术语候选集中去除基本词,并利用普通词语搭配前缀、后缀信息进一步过滤;最后对术语候选进行词法分析,利用术语的词性构成规则进...
关键词:术语抽取 互信息 语料 
自动提取词汇化树邻接文法被引量:2
《计算机应用》2005年第1期4-6,共3页许云 樊孝忠 张锋 
云南省信息技术项目基金资助项目(2002IT03)
提出了一种从宾州中文语料库中自动提取词汇化树邻接文法(LTAG)的算法。该算法的主要思想是从词汇化树库中归纳出三种类型的词汇化树,然后利用了中心词驱动短语结构文法的方法从语料库自动提取结构合理的词汇化树;最后由语言规则对不合...
关键词:词汇化树邻接文法 词汇化树 语料库 自然语言处理 
基于生成语法的英语时态判断被引量:3
《计算机工程与应用》2004年第26期226-228,232,共4页许云 樊孝忠 张锋 
为了帮助中学生掌握英语时态选择题,该文使用了生成语法的基本思想方法,但在其基础上引入了一些新的概念,使其能够在受限领域内可以有效地分析出英语时态选择题的正确答案。文章阐明如何利用现有的生成语法中产生式的思想方法,及新引入...
关键词:生成语法 规则 产生式 终结符 
基于统计的中文姓名识别方法研究被引量:23
《计算机工程与应用》2004年第10期53-54,77,共3页张锋 樊孝忠 许云 
该文在大规模标注语料的基础上统计分析了中文姓名前置词频率、中文姓氏用字频率、中文名字用字频率、中文姓名后置词频率。利用这些统计数据在词语粗分的基础上实现了中文姓名的自动识别,实验测试结果:准确率93.82%、召回率89.37%。
关键词:自动分词 未登录词 中文姓名识别 
在专家系统中利用关系数据库来表达知识被引量:37
《计算机工程与应用》2003年第22期91-93,138,共4页许云 樊孝忠 
在专家系统中,传统的知识表达方式具有很大的局限性,知识的重复利用率不高,并且无法给出知识的关系。为了解决这个问题,文章利用关系数据库的特点,将知识存贮在数据库中,并结合推理机的工作原理,阐明了如何利用标准数据查询语言(SQL)来...
关键词:专家系统 知识 关系数据库 
检索报告 对象比较 聚类工具 使用帮助 返回顶部