WEB新闻

作品数:33被引量:106H指数:6
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:吴共庆胡学钢刘鲁仲兆满李存华更多>>
相关机构:合肥工业大学北京航空航天大学淮海工学院西安电子科技大学更多>>
相关期刊:《郑州大学学报(理学版)》《福州大学学报(自然科学版)》《智能计算机与应用》《信息与电脑(理论版)》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家科技支撑计划长江学者和创新团队发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
面向Web新闻与博客的内容提取方法
《智能计算机与应用》2020年第7期1-4,10,共5页王金麟 方滨兴 于海宁 马雪阳 
国家重点研发计划(2016QY03D0501,2017YFB0803300);国家自然科学基金(61601146,61732022);四川省科技计划项目(2019YFSY0049)
Web深刻地改变了社会生活,新闻和博客网站作为其中代表性的消息来源,为人们提供了方便的信息获取方式。在Web分析的实际业务中,广告、文章推荐等无关信息的存在,给新闻和博客网页中主要内容的提取带来了负面影响。本文提出了一种区别于...
关键词:Web分析 内容提取 DOM树 
基于通配符节点话题权重的Web新闻抽取方法被引量:3
《计算机工程》2019年第4期275-280,共6页张恺航 徐克付 张闯 
国家自然科学基金(61602474)
现有Web新闻内容自动抽取方法多数未考虑文本中的话题特征,容易将样式排版与正文相似的噪音文本识别为正文内容。为此,提出基于通配符节点话题权重的抽取方法。将HTML文档解析成DOM树后,匹配DOM树对应的通配符树,并计算每个通配符中的...
关键词:内容抽取 通配符节点 最大相容类 OTSU算法 话题生成 
Web新闻智能处理与重发布系统
《信息与电脑》2018年第11期82-84,88,共4页彭银桥 范家诚 肖秀春 
广东省科技计划项目(项目编号:2016A010101028);广东海洋大学博士启动基金项目(项目编号:E15046)
笔者计了一个Web新闻智能处理与重发布系统,实现了从互联网信息源中提出有效的新闻信息,采用传统分析、学习分析及智能分析方法分级过滤广告,经编辑加工后发布到移动互联网。设计的数据存储索引树提高了广告过滤速度。测试结果和用户反...
关键词:新闻采集 重发布 广告过滤 数据存储索引树 智能处理 
基于块密度加权标签路径特征的Web新闻在线抽取被引量:3
《中国科学:信息科学》2017年第8期1078-1094,共17页吴共庆 刘鹏程 胡骏 胡学钢 
国家重点研发计划(批准号:2016YFB1000901);教育部创新团队发展计划(批准号:IRT13059);国家自然科学基金(批准号:612-73297;61673152);国家留学基金(批准号:201506695019)资助项目
Web新闻内容抽取是众多"大数据"和"大知识"应用的基础,也是一个开放性问题.标签路径特征和文本块密度特征是目前解决该问题的两类优良特征.标签路径特征能较好地区分全网页的内容与噪声,但难以识别内容块中的噪声和噪声块中的内容;文本...
关键词:内容抽取 WEB新闻 文本块密度 标签路径特征 在线算法 
基于Web新闻的案(事)件时空信息解析方法
《福州大学学报(自然科学版)》2017年第1期127-132,共6页吴镇城 吴升 卢毅敏 
国家“863”计划重大项目课题(2012AA12A208);福建省科技创新平台建设项目(2015H2001);海西政务大数据应用协同创新中心
探讨基于词库与规则相结合的案(事)件新闻文本时空信息解析方法.通过构建时间词库和表达规则、派出所和地名等词库以及"触发词-案事件类型"二元分类器,实现对案(事)件新闻中的案发时间、案发地点、案(事)件类型和出警派出所信息的抽取,...
关键词:时空信息 信息抽取 案(事)件 核密度估计 WEB新闻 
一种基于噪音过滤包装器的Web新闻抽取方法
《计算机与现代化》2017年第1期5-12,共8页孙梦 瞿有利 
中央高校基本科研业务费专项资金资助项目(2015JBM035)
从海量Web新闻网页中抽取高纯度新闻,并以结构化的形式存储,是舆情监测、话题更新等研究的基础。本文提出一种基于噪音过滤包装器的方法抽取Web新闻,归纳包装器时,若2页面字符串对比失配,计算其字符串标签路径比,根据阈值α,标记不同符...
关键词:信息抽取 包装器 新闻网页 ACME算法 字符串标签路径比 朴素贝叶斯分类器 
基于进化模糊规则的Web新闻文本挖掘与分类方法被引量:6
《湘潭大学自然科学学报》2016年第2期99-103,共5页史玉珍 吕琼帅 
河南省科技厅科技重点攻关项目(142102210226)
针对现有Web新闻文本分类方法准确率低且不能适应文本类型变化的问题,提出一种基于进化模糊规则的Web新闻文本挖掘和分类方法.首先,对每篇Web文本进行术语提取,并利用词频-逆向文档频率(TF-IDF)算法过滤掉一些具有较低描述能力的术语.然...
关键词:WEB新闻 文本分类 进化模糊规则 余弦距离 词频-逆向文档频率算法 
基于Web新闻的案(事)件抽取与时空分析系统
《测绘与空间地理信息》2016年第5期45-47,51,共4页吴镇城 卢毅敏 
国家"863"重大项目课题(2012AA12A208)资助
新闻,自古以来便是人们了解社会动态的重要途径,大数据时代,由于Web新闻自身所具有的客观性和真实性,其蕴含的数据价值凸显。针对新闻网站中案(事)件信息丰富、易采集等优点,研究开发一套基于Web新闻的案(事)件抽取与时空分析系统,抓取...
关键词:WEB新闻 案(事)件 自然语言处理 支持向量机 核密度分析 
基于SVM和词向量的Web新闻倾向性分析被引量:1
《现代计算机(中旬刊)》2016年第5期52-55,共4页肖宇伦 欧阳纯萍 刘志明 
湖南省哲学社会科学基金(No.14YBA335)
提出一种通过提取词向量,并利用机器学习对新闻文本进行分类的方法。首先,通过对预先收集好的新闻语料进行分析,获取到词的向量表示形式;然后通过新闻中的一些关键词提取出新闻的关键句;最后把词向量和关键句当中的关键词词性作为组合特...
关键词:新闻倾向性分析 SVM 词向量 词性特征 
基于标签路径特征融合的在线Web新闻内容抽取被引量:23
《软件学报》2016年第3期714-735,共22页吴共庆 胡骏 李莉 徐喆昊 刘鹏程 胡学钢 吴信东 
国家自然科学基金(61273297;61229301;61273292);教育部创新团队发展计划(IRT13059);国家重点基础研究发展计划(973)(2013CB329604);国家高技术研究发展计划(863)(2012AA011005)~~
精准地抽取新闻网页的内容,是提高Web新闻分析等应用系统工作质量的关键技术之一.由于缺少Web新闻出版的标准,存在大量不同的出版格式,并且Web本身是一种具有高度异构性的大数据载体,导致Web新闻内容抽取成为一个开放性问题.经大量实例...
关键词:内容抽取 WEB新闻 标签路径特征 组合特征选择 特征融合 
检索报告 对象比较 聚类工具 使用帮助 返回顶部