抽取方法

作品数:706被引量:2674H指数:21
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:余正涛吕学强程学旗高盛祥毛存礼更多>>
相关机构:北京百度网讯科技有限公司中国科学院国防科学技术大学平安科技(深圳)有限公司更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划国家社会科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 基金=国家科技支撑计划x
条 记 录,以下是1-10
视图:
排序:
基于BERT-BiLSTM-TFIDF的产品研发文档关键词抽取方法被引量:1
《工业工程与管理》2023年第2期99-106,共8页卢啸岩 郑宇 昝欣 
国家科技支撑计划课题(2015BAF18B00);国家自然科学基金资助项目(51505286);国家工信部智能制造专项(MC-201720-Z02)。
制造企业现有的内部知识管理系统大多通过人工选取产品研发文档标签,效率低下。应用自然语言处理技术抽取文档关键词作为文档标签有助于制造企业知识管理系统智能化。针对产品研发文档关键词抽取问题,提出了BERT-BiLSTM-TFIDF关键词自...
关键词:关键词抽取 产品研发文档 BERT-BiLSTM-TFIDF 
基于症状构成成分的上下位关系自动抽取方法被引量:1
《计算机应用》2017年第10期2999-3005,共7页王婷 王祺 黄越圻 殷亦超 高炬 
国家863计划项目(2015AA020107);国家科技支撑计划项目(2015BAH12 F01-05)~~
针对症状间上下位关系具有较强结构特性的问题,提出一种基于症状构成成分的上下位关系自动抽取方法。首先,通过观察症状实体,发现症状可以切分为原子症状词、修饰词等八种成分,且成分的构成序列满足一定的规则。然后,利用词法分析系统...
关键词:上下位关系 症状构成成分 条件随机场 关系分类 支持向量机 决策树 朴素贝叶斯 
面向领域概念的语义关系抽取方法被引量:4
《中国传媒大学学报(自然科学版)》2017年第3期34-40,共7页王舒琪 冯晓 张树武 关虎 
国家科技支撑计划课题"数字出版资源集成投送系统研发"(课题编号:2015BAH49F01)
提出了一个针对领域概念的开放式语义关系抽取方法,不需要预先定义关系类型,对句子进行依存句法分析,抽取最短依存路径,并通过添加启发式规则获取描述领域概念对的关系指示词。实验结果表明,所提出的方法是可行和有效的,能获得特定领域...
关键词:领域概念 语义关系 依存句法分析 最短依存路径 关系指示词 
一种短正文网页的正文自动化抽取方法被引量:2
《中文信息学报》2016年第1期8-15,共8页郗家贞 郭岩 黎强 赵岭 刘悦 俞晓明 程学旗 
国家重点基础研究发展计划(973)(2014CB340401;2013CB329602);国家自然科学基金重点项目(61232010);国家科技支撑专项(2012BAH39B04)
随着互联网的发展,网页形式日趋多变。短正文网页日益增多,传统的网页正文自动化抽取方式对短正文网页抽取效果较差。针对以上问题,该文提出一种单记录(新闻、博客等)、短正文网页的正文自动化抽取方法,在该方法中,首先利用短正文网页...
关键词:短正文 正文抽取 
基于超链接和DOM结构树的网页标题实时抽取方法被引量:2
《计算机与现代化》2015年第8期84-88,共5页张兵 汤进 罗斌 
国家高技术研究发展计划(863)项目(2014AA015104);国家自然科学基金资助项目(61472002);国家科技支撑计划项目(2012BAH95F00);安徽省电力公司科技项目(521200130M0U;5212M01353B4);安徽省科技计划项目科技攻关计划(科技强警)(1301b042002)
网页标题的正确抽取,在Web文本信息抽取领域有着重大意义。本文提出一种网页标题实时抽取方法。首先通过对目录型网页进行实时解析,接着采用基于超链接遍历的方法,并利用标题与发布时间的对应关系,最终获取对应目录型网页的URL及锚文本...
关键词:超链接 网页标题 发布时间 实时 信息抽取 
基于弱监督学习的主页人物属性抽取方法被引量:5
《山西大学学报(自然科学版)》2015年第1期8-15,共8页张巧 熊锦华 程学旗 
国家863计划课题(2014AA015204);国家科技支撑计划课题(2012BAH46B04);国家自然科学基金(61303244)
提出了一种基于弱监督学习的主页人物属性抽取方法,首先根据领域模式从个人主页中提取出人物属性的前导词,接着通过前导词获取人物属性作为初始的属性种子,在这些属性种子中提取属性的模式,并结合分类和bootstrapping方法不断迭代抽取...
关键词:人物属性抽取 前导词 属性模式 分类模型 BOOTSTRAPPING 
基于视觉特征的就业信息页面抽取方法被引量:2
《软件》2014年第9期16-20,共5页张昕 鄂海红 宋美娜 杨俊 
国家科技支撑计划课题(2013BAH10F01)项目"劳动者全生命周期的就业信息服务系统及应用示范";高等学校博士学科点专项科研基金课题(20110005120007);北京高等学校青年英才计划项目(YETP0445);教育部信息网络工程研究中心;北京市教育委员会共建项目专项资助
随着网络技术的发展,互联网上出现了大量的就业信息,但信息数据零散的以不同的呈现方式展现在各种就业信息网站中。为了解决传统的Web信息抽取方法中准确率和效率相矛盾的问题,本文通过采用基于网页视觉特征的模板生成方法,提出了一种...
关键词:WEB信息抽取 模板 VIPS DOM树 XPATH 
基于维基百科和条件随机场的领域主题词抽取方法被引量:1
《高技术通讯》2014年第6期602-608,共7页齐保元 史忠植 
973计划(2013CB329502);国家自然科学基金(61035003;60933004;61202212;61072085);863计划(2012AA011003);国家科技支撑计划(2012BA107B02);中国信息安全测评中心(CNITSEC-KY-2012-006/1)资助项目
针对传统的手工整理主题词表的方法因耗时、更新速度慢而无法满足应用要求的问题,提出了一种基于维基百科(Wikipedia)和条件随机场(CRF)的领域主题词抽取方法。该方法根据特定领域现有主题词的构词特点、统计分布特点,充分利用维基百科...
关键词:主题词表构建 主题词抽取 维基百科(Wikipedia) 条件随机场(CRF) 
一种基于本体的异构数据语义抽取方法被引量:2
《计算机与现代化》2014年第6期1-6,11,共7页成欣 李扬 
国家科技基础条件平台建设项目(2005DKA32800);材料领域知识工程北京市重点实验室2012年度阶梯计划资助项目(Z121101002812005);十二五国家科技支撑计划资助项目(2011BAK08B04);973国家重点基础研究发展计划资助项目(2013CB329606)
针对领域科学数据异构多样、缺乏语义的问题,本文提出一种基于本体的异构数据语义抽取方法。首先,构建领域科学数据的语义抽取框架,并在此基础上分别针对结构化、半结构化以及非结构化数据制定相应的语义转换与抽取规则,形成局部领域本...
关键词:本体 异构数据 语义抽取 数据集成 领域科学数据 
面向微博短文本的细粒度情感特征抽取方法被引量:29
《北京大学学报(自然科学版)》2014年第1期48-54,共7页贺飞艳 何炎祥 刘楠 刘健博 彭敏 
国家自然科学基金(61070083);国家科技支持计划子课题(2011BAK08B03-01)资助
结合TF-IDF方法与方差统计方法,提出一种实现多分类特征抽取的计算方法。采用先极性判断,后细粒度情感判断的处理方法,构建细粒度情感分析与判断流程,并将其应用于微博短文本的细粒度情感判断。通过NLP&CC2013评测所提供的训练语料对该...
关键词:自然语言处理 文本情感分析 细粒度情感 多分类特征抽取 
检索报告 对象比较 聚类工具 使用帮助 返回顶部