内容抽取

作品数:25被引量:103H指数:6
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:刘艳敏刘飚吴共庆谭建龙张智雄更多>>
相关机构:中国科学院中国科学院大学合肥工业大学燕山大学更多>>
相关期刊:《山东科技大学学报(自然科学版)》《情报杂志》《中国科学:信息科学》《计算机工程与设计》更多>>
相关基金:国家自然科学基金国家社会科学基金国家高技术研究发展计划长江学者和创新团队发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
语句层共被引关系内容抽取与分类及其应用研究——以Athar引用语料库为例被引量:1
《情报理论与实践》2023年第2期201-209,共9页魏晓俊 谭宗颖 苏娜平 
[目的/意义]语句层共被引的关系内容抽取与分类有助于揭示共被引论文间的主题关联。[方法/过程]文章从共被引主题的相似性和相关性出发,利用引用标注位置、作者、语义角色分析、句法分析等信息,将语句层共被引关系划分为同系列、同主题...
关键词:共被引 引用内容 引用关系分析 语义搜索 
民国南海文献知识元内容抽取规则研究被引量:5
《情报杂志》2022年第12期132-139,共8页孙浩洋 沈固朝 
教育部哲学社会科学重大项目“民国时期中国政府维护南海主权的档案资料整理与研究”(编号:11JZD011);国家社会科学基金重大项目“南海疆文献资料整理中的知识发现与维权证据链建构研究”(编号:19ZDA347)。
[研究目的]南海问题的深入研究,需要从海量历史文献中快速获得知识描述,实现由文献向语句描述的内容抽取,因此引入最小知识描述单位--知识元,并研究其抽取规则,为南海维权信息内容抽取提供新思路,以方便研究者快速浏览文献知识。[研究方...
关键词:知识元 知识元分类 知识元抽取 知识元描述规则 抽取规则 提炼规则 南海文献 
标准化文件表格内容抽取结构化应用探索被引量:1
《中国标准化》2022年第1期105-108,共4页谢燕 安姣姣 孙晓立 
标准文献中很多数据以表格的形式来呈现,为了实现表格中数据的查询,可以将表格数据抽取出来置入数据库中以实现单个数据的精准定位。本文阐述了PDF文件中表格数据的两种抽取方法,并将两种方法优劣做了比较,同时阐述了将表格数据结构化...
关键词:PDF文件 表格抽取 结构化 表格数据 
基于指代消解的引文内容抽取研究
《数据分析与知识发现》2021年第8期25-33,共9页谭荧 唐亦非 
国家社会科学基金重大项目(项目编号:19ZDA345)的研究成果之一。
【目的】为改善手动或简单的引文提取方法,提高引文内容分析效果,应精确抽取引文内容。【方法】将引文内容抽取任务具体分为引文句、引文上下文、引文元数据三部分,基于指代消解理论,利用机器学习和层次过滤法对引文上下文进行抽取。【...
关键词:信息抽取 指代消解 引文内容 引文上下文 
基于Scrapy与规则的公共文化机构官网信息采集与内容抽取
《图书情报研究》2021年第2期21-27,37,共8页申泳国 化柏林 
文化和旅游部重点实验室项目“公共文化智慧化模式聚类与动态展示系统研究”(项目编号:2020008)的阶段研究成果之一。
[目的/意义]公共文化服务机构在服务运营的过程中产生大量数据,既有宏观的年度统计数据,也有微观的活动通知、参加人数等细节数据,如何快速全面地获取这些数据并进行有效集成,是公共文化大数据分析与挖掘的一个前提。[方法/过程]在分析...
关键词:公共文化 信息采集 信息抽取 图书馆 文化馆 Scrapy 
基于Tree LSTM+CRF的属性级观点挖掘被引量:2
《山东科技大学学报(自然科学版)》2020年第6期115-122,共8页赵华 邹若飞 
青岛市哲学社会科学规划研究项目(QDSKL1901124);教育部人文社会科学研究青年基金项目(16YJCZH154)。
评价对象与观点内容的提取是观点挖掘中非常重要的任务。本研究提出了一个树结构长短期记忆网络(Tree LSTM)结合条件随机场(CRF)的联合模型抽取评价对象和观点内容。首先对评论句进行依存句法分析,根据句子的依存分析树构建Tree LSTM,...
关键词:观点挖掘 评价对象抽取 观点内容抽取 树结构长短期记忆网络 条件随机场 
基于决策树与单元距离抽取新闻网页内容
《晋中学院学报》2019年第3期66-71,共6页王晓 罗永莲 
山西省教育科学“十三五”规划课题:“基于创新创业教育理念的大数据相关专业教学模式研究”(GH-18091);晋中学院教学改革创新项目:“创新创业教育融入数据科学和大数据技术专业教育的案例研究”(Jg201807)
针对新闻网页文本处理问题,提出了一种基于决策树抽取新闻标题并利用单元距离识别正文的方法.该方法将文本相似度、网页标记和属性作为决策树节点选择的测试属性项,各属性项的信息熵计算同时考虑了与标题相关和不相关的因素,在此基础上...
关键词:信息增益 决策树 新闻网页 内容抽取 网页信息块 
基于通配符节点话题权重的Web新闻抽取方法被引量:3
《计算机工程》2019年第4期275-280,共6页张恺航 徐克付 张闯 
国家自然科学基金(61602474)
现有Web新闻内容自动抽取方法多数未考虑文本中的话题特征,容易将样式排版与正文相似的噪音文本识别为正文内容。为此,提出基于通配符节点话题权重的抽取方法。将HTML文档解析成DOM树后,匹配DOM树对应的通配符树,并计算每个通配符中的...
关键词:内容抽取 通配符节点 最大相容类 OTSU算法 话题生成 
科技文本中术语细粒度共现关系抽取与可视化分析被引量:11
《情报科学》2019年第3期81-87,共7页周萌 陈果 
国家社会科学青年基金项目"领域分析视角下的科技词汇语义挖掘与知识演化研究"(16CTQ024)
【目的/意义】传统共现分析方法应用于文本挖掘时,因关系粒度过粗导致难以有效利用文本内容中的语义关系。本文以武器装备简氏文本为例,提出基于文本内容的细粒度关系抽取和可视化分析方法。【方法/过程】首先,对原始简氏文本进行解析...
关键词:共现分析 细粒度 概念关联 文本挖掘 内容抽取 
基于块密度加权标签路径特征的Web新闻在线抽取被引量:3
《中国科学:信息科学》2017年第8期1078-1094,共17页吴共庆 刘鹏程 胡骏 胡学钢 
国家重点研发计划(批准号:2016YFB1000901);教育部创新团队发展计划(批准号:IRT13059);国家自然科学基金(批准号:612-73297;61673152);国家留学基金(批准号:201506695019)资助项目
Web新闻内容抽取是众多"大数据"和"大知识"应用的基础,也是一个开放性问题.标签路径特征和文本块密度特征是目前解决该问题的两类优良特征.标签路径特征能较好地区分全网页的内容与噪声,但难以识别内容块中的噪声和噪声块中的内容;文本...
关键词:内容抽取 WEB新闻 文本块密度 标签路径特征 在线算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部