许勇

作品数:6被引量:22H指数:3
导出分析报告
供职机构:北京工业大学计算机学院更多>>
发文主题:自然语言处理百科全书条件随机域模型隐马尔科夫模型HMM更多>>
发文领域:自动化与计算机技术语言文字更多>>
发文期刊:《中文信息学报》《信息安全与通信保密》《计算机工程与应用》《北京工业大学学报》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划教育部科学技术研究重点项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-6
视图:
排序:
基于半CRF模型的百科全书文本段落划分被引量:2
《北京工业大学学报》2008年第2期204-210,共7页许勇 宋柔 
国家自然科学基金(60272055);国家“八六三”计划资助项目(2001AA114111)
介绍了基于半条件随机域(semi-Markov conditional random fields,简称semi-CRFs)模型的百科全书文本段落划分方法.为了克服单纯的HMM模型和CRF模型的段落类型重复问题,以经过整理的HMM模型状态的后验分布为基本依据,使用了基于词汇语...
关键词:自然语言处理 机器学习 隐马尔科夫模型 文本段落划分 半条件随机域模型 
基于CRF的百科全书文本段落划分被引量:3
《计算机工程》2007年第10期16-18,共3页许勇 宋柔 
国家自然科学基金资助项目(60272055);国家"863"计划基金资助项目(2001AA110372-1)
CRF模型是标注、切分序列数据的较新的概率模型,在信息抽取等文本处理领域广受关注。该文介绍了CRF方法,并将其应用到百科全书文本段落的划分上,利用CRF的特征表述机制加入了文本单元序列中的长距离约束,取得了比传统的隐马尔科夫方法...
关键词:文本段落划分 条件随机域模型 隐马尔科夫模型 
Internet信息检查的关键技术研究
《微计算机应用》2006年第5期542-545,共4页马朝斌 喻国宝 许勇 张强弓 
为了快速准确地辅助核查人员审查Intemet上的信息内容,研究开发了Intemet信息检查搜索器,详细介绍了系统的功能组成及软件体系结构,提出了系统实现中的一些关键技术的实现方法和中标检查算法(KWHC)。
关键词:内容检查 中标检查 网络搜索 
基于HMM的百科辞典文本中句子的知识点分类被引量:5
《计算机工程与应用》2005年第4期35-37,133,共4页许勇 宋柔 
国家自然科学基金(编号:60272055);国家863高技术研究发展计划(编号:2001AA114111)资助
在百科全书条目文本中,往往以几个不同的侧面说明一个条目,一个侧面构成有关这一条目的一个知识点。知识点是一般文本处理领域中话题这一概念在百科全书文本中的具体表现。属于同一个类型的条目文本中总是重复出现有限的几个知识点,这...
关键词:HMM 百科辞典知识获取 自然语言处理 
Web搜索与特定内容核查技术初探
《信息安全与通信保密》2004年第12期36-38,共3页许勇 喻国宝 马朝斌 
    为了快速、高效、准确地对Internet 上发布的Web 信息进行内容核查,本文提出了一种多层结构的Web搜索与特定内容核查软件的系统结构,分析了该结构的技术特点,并阐述了基于信息检索(IR)的特定内容核查的技术和方法。
关键词:WEB搜索 WEB信息 多层结构 软件 核查 信息检索 发布 内容 特定 初探 
基于互连网的术语定义获取系统被引量:13
《中文信息学报》2004年第4期37-43,共7页许勇 荀恩东 贾爱平 宋柔 
国家自然科学基金资助项目 (6 0 2 72 0 5 5 ) ;国家 86 3计划资助项目 (2 0 0 1AA1 1 4 1 1 1 )
文中介绍了一个实验性的基于互联网的术语定义获取系统 ,可以方便、迅速的从互连网上查找术语的定义以及与定义有关的内容 ,给用户迅速获得新生术语以及新技术词汇的定义方面的知识提供方便。系统采用一组术语定义的语言学模式 ,以多线...
关键词:人工智能 自然语言处理 术语定义 信息抽取 
检索报告 对象比较 聚类工具 使用帮助 返回顶部