抽取

作品数:8767被引量:23464H指数:55
导出分析报告
相关领域:自动化与计算机技术医药卫生更多>>
相关作者:杨静宇余正涛朱巧明程学旗周国栋更多>>
相关机构:北京邮电大学中国科学院哈尔滨工业大学清华大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 作者=黄河燕x
条 记 录,以下是1-9
视图:
排序:
融合实体和上下文信息的篇章关系抽取研究
《自动化学报》2024年第10期1953-1962,共10页黄河燕 袁长森 冯冲 
篇章关系抽取旨在识别篇章中实体对之间的关系.相较于传统的句子级别关系抽取,篇章级别关系抽取任务更加贴近实际应用,但是它对实体对的跨句子推理和上下文信息感知等问题提出了新的挑战.本文提出融合实体和上下文信息(Fuse entity and ...
关键词:篇章关系抽取 实体信息 上下文信息 提及位置信息 跨句子推理 
面向新领域的事件抽取研究综述被引量:7
《智能系统学报》2022年第1期201-212,共12页黄河燕 刘啸 
国家自然科学基金项目(U19B2020).
在当前互联网时代,大量新领域下的非结构文本数据中蕴含了海量信息。面向新领域的事件抽取方法研究能快速地构建领域知识库,用于支撑基于知识的下游应用。但现有事件抽取系统的领域限定性强,在新领域中从零构建会极度依赖事件体系和标...
关键词:事件抽取 新领域 信息抽取 事件模板推导 联合抽取 事件真实性检测 自然语言处理 知识库 
融合对抗学习的因果关系抽取被引量:20
《自动化学报》2018年第5期811-818,共8页冯冲 康丽琪 石戈 黄河燕 
因果关系抽取在事件预测、情景生成、问答以及文本蕴涵等任务上都有重要的应用价值.但多数现有的因果关系抽取方法都需要人工定义模式和约束,且严重依赖知识库.为此,本文利用生成式对抗网络(Generative adversarial networks,GAN)的对...
关键词:因果关系抽取 生成式对抗网络 注意力机制 对抗学习 
基于级联模型的中文情感要素抽取被引量:2
《电子学报》2016年第10期2459-2465,共7页王亚珅 黄河燕 冯冲 刘全超 
国家重点基础研究发展计划(973计划)资助项目(No.2013CB329605;No.2013CB329303);国家自然科学基金(No.61132009;No.61201351)
随着社交媒体的发展及成熟,每天在互联网环境中都会产生大量的用户评论信息.抽取评价短语、评价对象和观点持有者等情感要素,已经成为了中文观点挖掘和情感分析的重要先决任务.针对中文情感要素抽取任务,本文提出了一个统计和规则相结...
关键词:信息抽取 情感要素 评价短语 评价对象 观点持有者 
面向中文微博的评价对象与评价词语联合抽取被引量:4
《电子学报》2016年第7期1662-1670,共9页刘全超 黄河燕 冯冲 
国家973重点基础研究发展计划(No.2013CB329605)
深入挖掘微博内容中评价对象与评价词语的词法特征、句法特征、语义特征以及相对位置特征,提出评价对象与评价词语的序列化联合抽取模型.进一步结合微博间转发关系特性提出基于转发关系的联合抽取优化算法.并与相关算法进行实验对比,对...
关键词:观点挖掘 信息抽取 社交网络 评价对象 评价词语 微博 
最长评价短语及其情感评价搭配抽取方法
《数据采集与处理》2016年第2期296-306,共11页刘全超 黄河燕 王亚珅 冯冲 
国家重点基础研究发展计划("九七三"计划)(2013CB329605)资助项目
提出一种统计和规则相结合的最长评价短语自动识别算法。将评价短语的识别问题转化为序列标注问题,结合条件随机场模型进行简单结构的评价短语识别,在此基础上进一步建立和应用规则库,自动识别结构复杂的最长评价短语,其测试的F值达到72...
关键词:情感分析 观点挖掘 评价短语 条件随机场 
基于多策略融合的中文术语抽取方法被引量:28
《情报学报》2010年第3期460-467,共8页周浪 史树敏 冯冲 黄河燕 
国家863高技术研究发展计划资助项目(2006AA01Z152); 国家自然科学基金资助项目(60672149)
中文术语抽取是信息抽取、文本挖掘以及知识获取等信息处理任务中的关键技术。相对于单词型术语,词组型术语的识别过程要更加复杂。由于短语中引入了大量非名词性词汇,随之产生了更多种的噪声数据,不仅需要判断短语结构是否完整,还要考...
关键词:中文术语抽取 语言规则获取 子串归并 搭配检验 词语活跃度 领域相关度 
一种面向术语抽取的短语过滤技术被引量:7
《计算机工程与应用》2009年第19期9-11,共3页周浪 冯冲 黄河燕 
国家自然科学基金(No.60672149);国家高技术研究发展计划(863)(No.2006AA01Z152;No.2006AA010109)~~
在术语抽取工作中,经常会遇到一些包含活跃词汇的短语或短语碎片,这些干扰项一般具有稳定的搭配模式,并且在语料中共现的概率也非常高。常用的短语过滤方法都是侧重于计算短语内部词语之间的黏合度,对这些干扰项的鉴别能力并不强。提出...
关键词:术语抽取 短语过滤 左右熵 活跃因子 
中文文本分类中特征抽取方法的比较研究被引量:230
《中文信息学报》2004年第1期26-32,共7页代六玲 黄河燕 陈肇雄 
国家自然科学基金资助项目 (6 0 2 72 0 88)
本文比较研究了在中文文本分类中特征选取方法对分类效果的影响。考察了文档频率DF、信息增益IG、互信息MI、χ2分布CHI四种不同的特征选取方法。采用支持向量机 (SVM )和KNN两种不同的分类器以考察不同抽取方法的有效性。实验结果表明 ...
关键词:计算机应用 中文信息处理 文本自动分类 特征抽取 支持向量机 KNN 
检索报告 对象比较 聚类工具 使用帮助 返回顶部