尹红风

作品数:14被引量:87H指数:6
导出分析报告
供职机构:西南交通大学信息科学与技术学院更多>>
发文主题:中文人工智能思维网络百科百科更多>>
发文领域:自动化与计算机技术自然科学总论更多>>
发文期刊:《计算机应用与软件》《计算机应用研究》《山东大学学报(工学版)》《上海理工大学学报》更多>>
所获基金:国家自然科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
信息检索中一种句子相似度的计算方法
《应用科技》2014年第4期41-46,共6页刘云芳 杨燕 贾真 尹红风 杨宇飞 
国家自然科学基金资助项目(61170111;61152001);中国科学院自动化所复杂系统管理与控制重点实验室开放课题资助项目(20110102);中央高校基本科研业务费专项基金资助项目(SWJTU11ZT08)
为提高信息检索中检索结果的查准率,提出了基于句法分析以及带权路径长度的句子相似度计算方法。该方法首先对用户问句进行了分词、词性标注以及句法分析处理,并根据处理后的结果对该句进行了关键词提取、加权和同义词近义词扩展处理。...
关键词:信息检索 相似度 词性标注 句法分析 带权路径长度 二次排序 查准率 
基于规则的汉语兼类词标注方法被引量:2
《计算机应用》2014年第8期2197-2201,共5页李华栋 贾真 尹红风 杨燕 
国家自然科学基金资助项目(61134002;61170111;61202043;61262058)
针对目前汉语兼类词标注的准确率不高的问题,提出了规则与统计模型相结合的兼类词标注方法。首先,利用隐马尔可夫、最大熵和条件随机场3种统计模型进行兼类词标注;然后,将改进的互信息算法应用到词性(POS)标注规则的获取上,通过计算目...
关键词:词性标注 互信息 汉语兼类词 规则 中文信息处理 
基于多特征融合的网页正文信息抽取被引量:4
《计算机应用与软件》2014年第7期47-49,77,共4页刘利 戴齐 尹红风 贾真 胡万亭 
国家自然科学基金项目(61152001;61170111);中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题(20110102)
当今主流网页分为单正文体网页和多正文体网页。这些网页的正文信息都具有多个正文特征。想要准确定位正文信息所在位置,可以从其所具有的多个特征和网页设计者的设计习惯着手。鉴于此,融合这些特征提出一种基于多特征融合的网页正文信...
关键词:单正文体 多正文体 多特征 信息抽取 
基于SimRank的百度百科词条语义相似度计算被引量:10
《山东大学学报(工学版)》2014年第3期29-35,共7页尹坤 尹红风 杨燕 贾真 
国家自然科学基金资助项目(61152001;61170111);中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题资助项目(20110102);中央高校基本科研业务费专项资金资助项目(SWJTU11ZT08)
提出一种利用百度百科半结构化数据自动获取词语相似度的方法,该方法将百科词条与其相关词条看做有向图的两个节点,且两节点相互之间存在着链接关系,然后利用SimRank算法计算百科词条语义相似度。实验表明,该方法优于传统的词语语义相...
关键词:语义相似度 百科词条 有向图 SIMRANK 
面向中文网络百科的属性和属性值抽取被引量:12
《北京大学学报(自然科学版)》2014年第1期41-47,共7页贾真 杨宇飞 何大可 刘胜久 尹红风 
国家自然科学基金(61170111;61202043;61262058);中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题(20110102);中央高校基本科研业务费专项基金(SWJTU11ZT08)资助
针对面向中文网络百科条目文章的属性和属性值抽取,提出一种无监督方法。此方法将属性值看做命名实体,利用频繁模式挖掘和关联分析,从文本中抽取类别属性;采用自扩展方法为属性建立触发词表;基于属性触发词和属性值实体标注挖掘属性值...
关键词:知识获取 属性抽取 非结构化文本 模式挖掘 
基于弱监督的属性关系抽取方法被引量:10
《计算机应用》2014年第1期64-68,共5页杨宇飞 戴齐 贾真 尹红风 
国家自然科学基金资助项目(61170111;61202043;61262058);中央高校基本科研业务费专项资金资助项目(SWJTU11ZT08);中国科学院自动化所复杂系统管理与控制重点实验室开放课题(20110102)
针对从中文百科中抽取属性关系时所面临的训练语料匮乏问题,提出一种利用极少人工参与的弱监督自动抽取方法。首先,利用中文百科条目信息模板中的半结构化属性关系回标条目文本自动获取训练语料;然后,根据朴素贝叶斯分类原理优化训练语...
关键词:关系抽取 弱监督 中文百科 朴素贝叶斯分类 条件随机场 
一种基于词频统计的组织机构名识别方法被引量:15
《计算机应用研究》2013年第7期2014-2016,共3页胡万亭 杨燕 尹红风 贾真 刘利 
国家自然科学基金资助项目(61152001;61170111);中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题(20110102)
命名实体识别是自然语言处理必不可少的重要部分,其中组织机构名识别占了很大的比例。提出了基于词频统计的组织机构名识别方法。训练数据主要通过百度百科词条整理得到。训练时,利用百度百科词条名在词条文本中的频数统计进行机构构成...
关键词:统计 词频 机构名构成词 组织机构名识别 
中文网络百科开放分类层次结构树及其聚类算法研究被引量:2
《计算机应用研究》2013年第6期1660-1663,1674,共5页贾真 尹红风 李天瑞 
国家自然科学基金委员会主任基金资助项目(61152001);中国科学院自动化所复杂系统管理与控制重点实验室开放课题(20110102);中央高校基本科研业务费专项基金资助项目(SWJTU11ZT08)
为利用开放分类进行百科条目的分类和检索,提出了基于词共现和语义分析的开放分类聚类算法以及开放分类层次结构树构建方法;为了进一步提高层次结构树的聚合度,提出了基于相似度和相关度计算的层次结构树聚类算法。以互动百科开放分类...
关键词:开放分类 聚类 共现 语义分析 层次结构树 
基于规则的百科人物属性抽取被引量:3
《集成技术》2013年第3期1-4,共4页李红亮 杨燕 尹红风 贾真 
国家自然科学基金(61152001;61170111);中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题(20110102);中央高校基本科研业务费专项资金(SWJTU11ZT08)
信息抽取是数据挖掘的一个重要领域,文本信息抽取是指从一段自由文本中抽取出指定的信息并将其结构化数据存入知识库供用户查询或下一步处理所用。人物属性信息抽取是智能人物类搜索引擎构建的重要基础,同时结构化信息也是计算机所能理...
关键词:人物属性抽取 规则获取 自由文本 
一种改进的基于树路径匹配的网页结构相似度算法被引量:7
《吉林大学学报(理学版)》2012年第6期1199-1203,共5页廖浩伟 杨燕 贾真 尹红风 
国家自然科学基金(批准号:61152001:61170111);中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题基金(批准号:20110102);中央高校基本科研业务费专项基金(批准号:SWJTU11ZT08)
提出一种改进的基于树路径匹配的网页结构相似度算法,该算法定义了树路径的序列相似度和位置相似度,找出网页的树路径集合,通过网页间的最佳树路径匹配计算结构相似度.实验结果表明,用改进后的算法计算网页结构相似度比传统树路径匹配...
关键词:网页结构相似度 序列相似度 位置相似度 
检索报告 对象比较 聚类工具 使用帮助 返回顶部