赵世奇

作品数:10被引量:134H指数:6
导出分析报告
供职机构:哈尔滨工业大学更多>>
发文主题:人工智能自然语言处理基于主题聚类方法文本更多>>
发文领域:自动化与计算机技术文化科学更多>>
发文期刊:《模式识别与人工智能》《电子学报》《中文信息学报》《智能计算机与应用》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划哈尔滨工业大学校科学研究基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
Web查询日志研究综述被引量:8
《电子学报》2013年第9期1800-1808,共9页付博 赵世奇 刘挺 
国家自然科学基金(No.60736044;No.61073126)
本文对查询日志在相关领域内的研究现状与进展进行了总结.首先介绍了web查询日志的常用信息和公开的数据集;进而阐述了查询日志在web搜索、信息抽取等方面的相关研究,并对它们进行了细致的介绍和分析;最后指出基于查询日志研究所面临的...
关键词:查询日志分析 查询日志挖掘 WEB搜索 信息抽取 
融合多类特征的Web查询意图识别被引量:12
《模式识别与人工智能》2012年第3期500-505,共6页伍大勇 赵世奇 刘挺 张宇 
国家自然科学基金项目(No.60736044);国家863计划项目(No.2008AA01Z144)资助
识别搜索引擎用户的查询意图在信息检索领域是备受关注的研究内容.文中提出一种融合多类特征识别Web查询意图的方法.将Web查询意图识别作为一个分类问题,并从不同类型的资源包括查询文本、搜索引擎返回内容及Web查询日志中抽取出有效的...
关键词:搜索引擎 查询意图 特征融合 
面向互联网的计算语言学研究被引量:1
《智能计算机与应用》2011年第1X期8-12,23,共6页王海峰 赵世奇 
近年来,计算语言学(ComputationalLinguistics:CL)在学术界和工业界均得到了越来越多的关注,这主要得益于其在互联网领域越来越广泛的应用,如搜索引擎、在线翻译系统、社交网络等。计算语言学的很多技术在互联网应用中都能找到用...
关键词:计算语言学 互联网 
基于二元分类的复述搭配抽取被引量:1
《软件学报》2010年第6期1267-1276,共10页赵世奇 赵琳 刘挺 李生 
国家自然科学基金Nos.60803093;60675034;国家高技术研究发展计划(863)No.2008AA01Z144~~
以动宾关系的搭配为例研究复述搭配的抽取.具体地,该方法将复述搭配抽取视作二元分类问题,并综合使用了基于翻译、词典、极性词以及网络挖掘的多种特征.实验结果表明,所采用的二元分类方法对于抽取复述搭配是行之有效的,其中使用的各种...
关键词:复述搭配 二元分类 复述特征 
复述技术研究被引量:15
《软件学报》2009年第8期2124-2137,共14页赵世奇 刘挺 李生 
国家自然科学基金Nos.60803093;60675034;国家高技术研究发展计划(863)No.2008AA01Z144~~
对自然语言处理研究中的复述的研究现状与进展进行了总结,分别介绍了复述的应用、复述资源的获取、复述句的生成、复述的评测以及与复述紧密联系的相关研究等.重在对复述研究的主流方法和前沿进展进行概括、比较和分析,以期对后续研究...
关键词:复述 复述获取 复述生成 评测 
基于网络挖掘的上下文相关词汇级复述研究(英文)被引量:2
《软件学报》2009年第7期1746-1755,共10页赵世奇 张宇 赵琳 刘挺 李生 
Supported by the National Natural Science Foundation of China under Grant Nos.60503072,60575042~~
词汇级复述研究旨在为词汇获取复述.词汇级复述是上下文相关的,即对同一个词在不同上下文中应获取不同的复述词.提出了一种获取上下文相关词汇级复述的方法.该方法包括两部分:基于网络挖掘的候选复述词获取以及基于二元分类的复述词确认...
关键词:词汇级复述 上下文相关 网络挖掘 复述抽取 复述确认 
基于自动构建语料库的词汇级复述研究被引量:3
《电子学报》2009年第5期975-980,共6页赵世奇 刘挺 李生 
国家自然科学基金(No.60803093;No.60675034);国家863高技术研究发展计划(No.2008AA01Z144)
本文针对词汇级复述问题提出了一种新的方法.该方法首先利用翻译引擎将双语平行语料库自动转换为单语平行语料库,以此构建复述语料库并用于候选复述的抽取.在此基础上,本文提出了一种新的统计模型.该模型根据特定的上下文为待复述词选...
关键词:词汇级复述 复述语料库 复述模型 
一种基于主题的文本聚类方法被引量:24
《中文信息学报》2007年第2期58-62,共5页赵世奇 刘挺 李生 
国家自然科学基金资助项目(60575042;60503072;60675034);腾讯基金资助项目
现有的文本聚类方法难以正确识别和描述文本的主题,从而难以实现按照主题对文本进行聚类。本文提出了一种新的基于主题的文本聚类方法:LFIC。该方法能够准确识别文本主题并根据文本的主题对其进行聚类。本方法定义和抽取了“主题元素”...
关键词:人工智能 模式识别 基于主题文本聚类 基本类索引 语言学特征 
基于类别特征域的文本分类特征选择方法被引量:21
《中文信息学报》2005年第6期21-27,共7页赵世奇 张宇 刘挺 陈毅恒 黄永光 李生 
国家自然科学基金重点资助项目(60435020)
特征选择是文本分类的关键问题之一,而噪音与数据稀疏则是特征选择过程中遇到的主要障碍。本文介绍了一种基于类别特征域的特征选择方法。该方法首先利用“组合特征抽取”[1]的方法去除原始特征空间中的噪音,从中抽取出候选特征。这里,...
关键词:计算机应用 中文信息处理 文本分类 特征选择 类别特征域 
自然语言文本水印被引量:51
《中文信息学报》2005年第1期56-62,70,共8页张宇 刘挺 陈毅恒 赵世奇 李生 
国家自然科学基金资助 (6 0 4 35 0 2 0 );哈尔滨工业大学校科学研究基金资助 (hit.2 0 0 2 73)
本文主要介绍了基于自然语言处理的文本水印技术 ,也即自然语言文本水印技术。该技术是在不改变文本原意的前提下 ,将需要隐藏的文本信息 (水印信息 )插入到原始文本中的一种信息隐藏技术。这种技术对于确认信息来源和信息的秘密传送 ,...
关键词:人工智能 自然语言处理 文本水印 二次余数 本体语义 
检索报告 对象比较 聚类工具 使用帮助 返回顶部