抽取方法

作品数:706被引量:2674H指数:21
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:余正涛吕学强程学旗高盛祥毛存礼更多>>
相关机构:北京百度网讯科技有限公司中国科学院国防科学技术大学平安科技(深圳)有限公司更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划国家社会科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 基金=国家重点基础研究发展计划x
条 记 录,以下是1-10
视图:
排序:
基于序列标注的漏洞信息结构化抽取方法被引量:3
《计算机应用与软件》2020年第2期266-271,276,共7页陈钧衍 陶非凡 张源 
国家自然科学基金项目(U1636204,61602123,U1836210,U1736208,U1836213,61602121);国家重点基础研究发展计划项目(2015CB358800);上海市青年科技英才扬帆计划项目(16YF1400800)。
从漏洞信息当中抽取结构化信息对于安全研究而言有重要意义。安全研究者常需要在大规模的CVE数据中按特定要求进行筛选,或对漏洞进行自动化的分析测试。然而现有的CVE数据库中只包含了非结构化的文本描述和并不完备的辅助信息。从描述...
关键词:CVE 机器学习 自然语言处理 
一种基于约束依赖性分析的RDFS模式抽取方法被引量:3
《软件学报》2020年第2期344-355,共12页赵晓非 史忠植 田东平 刘建伟 
国家重点基础研究发展计划(973)(2013CB329502);国家自然科学基金(61035003);江苏省计算机信息处理技术重点实验室开放基金(KJS1737);陕西省科技厅工业攻关项目(2018GY-037).
为了验证RDFS(resource description framework schema)本体的正确性所执行的推理是一项计算开销很大的任务,该任务在附加约束存在的条件下变得更加复杂.提出了一种旨在不改变推理结果的前提下,对RDFS模式进行抽取的方法.该方法基于对...
关键词:RDFS(resource DESCRIPTION framework schema) 约束 本体抽取 依赖性分析 
一种面向医学文本数据的结构化信息抽取方法被引量:16
《小型微型计算机系统》2019年第7期1479-1485,共7页杨兵 聂铁铮 申德荣 寇月 于戈 
国家重点研究发展计划项目(2018YFB1003404)资助;国家自然科学基金项目(61672142,61402213,U1435216)资助;中央大学基础研究基金项目(N150408001-3,N150404013)资助
医学文本作为医疗领域重要的信息载体,为临床诊断和病理学研究提供了重要的数据支持,然而使用自然语言编写的文本数据往往是非结构化的,不便于机器理解和自动化处理.对于中文的医学文本数据而言,由于专业性强,需要丰富的领域知识,并且...
关键词:结构化信息抽取 文本聚类 关键词提取 语义依存 
最长评价短语及其情感评价搭配抽取方法
《数据采集与处理》2016年第2期296-306,共11页刘全超 黄河燕 王亚珅 冯冲 
国家重点基础研究发展计划("九七三"计划)(2013CB329605)资助项目
提出一种统计和规则相结合的最长评价短语自动识别算法。将评价短语的识别问题转化为序列标注问题,结合条件随机场模型进行简单结构的评价短语识别,在此基础上进一步建立和应用规则库,自动识别结构复杂的最长评价短语,其测试的F值达到72...
关键词:情感分析 观点挖掘 评价短语 条件随机场 
一种短正文网页的正文自动化抽取方法被引量:2
《中文信息学报》2016年第1期8-15,共8页郗家贞 郭岩 黎强 赵岭 刘悦 俞晓明 程学旗 
国家重点基础研究发展计划(973)(2014CB340401;2013CB329602);国家自然科学基金重点项目(61232010);国家科技支撑专项(2012BAH39B04)
随着互联网的发展,网页形式日趋多变。短正文网页日益增多,传统的网页正文自动化抽取方式对短正文网页抽取效果较差。针对以上问题,该文提出一种单记录(新闻、博客等)、短正文网页的正文自动化抽取方法,在该方法中,首先利用短正文网页...
关键词:短正文 正文抽取 
一种基于邮件列表的软件问答信息抽取方法被引量:1
《计算机科学》2015年第12期23-25,35,共4页罗宇翔 邹艳珍 金庸 谢冰 
国家高技术研究发展计划(863)(2013AA01A605);国家重点基础研究发展规划(973)(2011CB302604);国家自然科学基金(61103024)资助
开源项目通常会提供邮件列表来帮助用户更好地理解和使用开源项目。但由于邮件的数量巨大、邮件内容组织繁杂、问题不明确、答案定位困难等问题,用户在邮件查询过程中定位一个特定的软件问答信息要花费大量的时间和精力。为此,提出一种...
关键词:软件复用 数据挖掘 邮件列表 软件问答 
一种领域合成词的抽取方法
《太赫兹科学与电子信息学报》2014年第6期870-873,878,共5页刘剑 
国家973计划资助项目(2012CB316303);国家自然科学基金资助项目(60933005)
构建领域本体的首要任务是获取领域相关的概念,这些概念很多是由常用词典库中没有收录的领域合成词组成,因此抽取领域合成词对于领域本体的构建至关重要。本文基于语言规则和统计技术,提出一种结合改进互信息和语言模板的领域合成词抽...
关键词:领域本体 互信息 语言模板 领域合成词 
基于维基百科和条件随机场的领域主题词抽取方法被引量:1
《高技术通讯》2014年第6期602-608,共7页齐保元 史忠植 
973计划(2013CB329502);国家自然科学基金(61035003;60933004;61202212;61072085);863计划(2012AA011003);国家科技支撑计划(2012BA107B02);中国信息安全测评中心(CNITSEC-KY-2012-006/1)资助项目
针对传统的手工整理主题词表的方法因耗时、更新速度慢而无法满足应用要求的问题,提出了一种基于维基百科(Wikipedia)和条件随机场(CRF)的领域主题词抽取方法。该方法根据特定领域现有主题词的构词特点、统计分布特点,充分利用维基百科...
关键词:主题词表构建 主题词抽取 维基百科(Wikipedia) 条件随机场(CRF) 
一种基于本体的异构数据语义抽取方法被引量:2
《计算机与现代化》2014年第6期1-6,11,共7页成欣 李扬 
国家科技基础条件平台建设项目(2005DKA32800);材料领域知识工程北京市重点实验室2012年度阶梯计划资助项目(Z121101002812005);十二五国家科技支撑计划资助项目(2011BAK08B04);973国家重点基础研究发展计划资助项目(2013CB329606)
针对领域科学数据异构多样、缺乏语义的问题,本文提出一种基于本体的异构数据语义抽取方法。首先,构建领域科学数据的语义抽取框架,并在此基础上分别针对结构化、半结构化以及非结构化数据制定相应的语义转换与抽取规则,形成局部领域本...
关键词:本体 异构数据 语义抽取 数据集成 领域科学数据 
基于键规则的XML实体抽取方法被引量:12
《计算机研究与发展》2014年第1期64-75,共12页刘显敏 李建中 
国家"九七三"重点基础研究发展计划基金项目(2012CB316200);国家自然科学基金青年基金项目(61003046)
XML上实体抽取问题的任务是要从XML数据中抽取出描述现实世界某个物理实体的数据实体.利用XML查询提供实体的表示方法,基于键规则中有关实体的语义信息,给出了求解XML上实体抽取问题的基于键规则的实体抽取(key-based entity extraction...
关键词:XML数据 键规则 实体抽取 查询松弛 共享计算 
检索报告 对象比较 聚类工具 使用帮助 返回顶部