WEB论坛

作品数:13被引量:48H指数:5
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:马军李弼程王允林琛关冕更多>>
相关机构:山东大学四川大学解放军信息工程大学武汉大学更多>>
相关期刊:《计算机工程与设计》《中文信息学报》《图书馆学研究》《网络安全技术与应用》更多>>
相关基金:国家自然科学基金山东省自然科学基金国家高技术研究发展计划山东省科技攻关计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于Nutch的Web论坛分块采集系统被引量:1
《图书馆学研究》2017年第7期56-60,共5页程杜新 傅魁 
随着网络论坛用户的不断增长,论坛帖子数量急剧增加,论坛结构不断变化,研究适用于整个Web论坛信息采集解析的定向、自动、准确的采集方法是网络爬虫领域研究的难点。由论坛领域建模、论坛模板解析、论坛板块采集及论坛帖子采集四大模块...
关键词:NUTCH WEB论坛 信息采集 分块解析 
基于DOM树的通用论坛抽取技术被引量:1
《网络安全技术与应用》2015年第1期20-20,共1页邓垦 胡勇 
web论坛中蕴含着海量的信息资源,抽取论坛数据意义重大,因此本文提出了一种基于DOM树的通用论坛抽取方法,通过统计页面中的div标签频率,抽取出分布于各楼层中的主题信息。该方法无需人工干预,能够实现完全的自动化抽取。实验结果证明,...
关键词:WEB论坛 抽取 DOM 自动化 
基于动态主题建模的Web论坛文档摘要被引量:8
《计算机研究与发展》2012年第11期2359-2367,共9页任昭春 马军 陈竹敏 
国家自然科学基金项目(60970047;61103151;61173068);山东省自然科学基金项目(ZR2012FM037)
针对论坛文档由于自身特点缺乏有效的文档摘要方法的现状,提出一种基于LDA主题模型的论坛文档摘要方法.在主题建模中考虑了Web论坛文档中帖子和帖子之间的回复关系,并把主题的分布变为随文档变化而变化的一个动态过程,来解决主题的依赖...
关键词:WEB论坛 论坛文档摘要 主题建模 Gibbs EM采样 文档摘要 
一种基于LDA的Web论坛低质量回帖检测方法被引量:4
《计算机研究与发展》2012年第9期1937-1946,共10页韩晓晖 马军 邵海敏 薛冉 
国家自然科学基金项目(60970047;61103151;61173068);山东省自然科学基金项目(Y2008G19);山东大学自主创新基金项目(11150070613165)
为了过滤Web论坛中的低质量回帖,提出了一种新的基于LDA(latent Dirichlet allocation)的低质量回帖检测方法.不同于以往的方法,该方法在对回帖进行质量分类时使用了两类特征:语义特征和统计特征.提出并定义了垃圾/非重要(J/Ⅰ)主题比...
关键词:WEB论坛 主题模型 主题分布 低质量回帖 语义特征 分类 
面向Web论坛的网络信息获取技术及系统实现被引量:7
《计算机工程与科学》2011年第1期157-160,共4页彭冬 蔡皖东 
国家863计划资助项目(2009AA01Z424);2009届西北工业大学本科毕业设计重点扶持项目
网络爬虫技术是网络信息获取的重要手段,面向Web论坛的信息获取则是网络爬虫技术所面临的新课题。在分析和研究面向Web论坛信息获取技术的基础上,本文设计和实现了一种用于Web论坛信息获取的主题网络爬虫系统,根据Web论坛信息组织结构,...
关键词:网络爬虫 WEB论坛 正文提取 主题相关度 
Web论坛数据源增量爬虫的研究被引量:5
《计算机工程》2010年第9期285-287,共3页蔡欣宝 郭若飞 赵朋朋 崔志明 
国家自然科学基金资助项目(60673092);2008年江苏省重大科技支撑与自主创新基金资助项目(BE2008044)
针对Web论坛站点结构复杂、内容更新快等特点,提出一种针对论坛的增量信息采集算法,使用站点地图重建技术及网页更新频繁度估计方法,根据站点地图选择有效的链接,按照网页更新频度确定网页的采集频度。实验结果表明,该方法是有效的。
关键词:WEB论坛 增量爬虫 站点地图 泊松模型 
针对Web论坛的一种结构化数据自动抽取方法被引量:1
《山东大学学报(理学版)》2010年第5期42-47,共6页关冕 马军 
国家自然科学基金资助项目(60970047);山东省自然科学基金资助项目(Y2008G19);山东省科技攻关资助项目(2008GG10001026;2007GG10001002)
由于网页布局设计的复杂性和用户发表帖子的灵活性,从论坛网页中抽取结构化的数据是一项未能很好解决并非常具有挑战性的任务。本文提出了一种从任意的论坛站点中自动抽取结构化数据的通用解决方案,通过分析网页结构发现列表页和帖子页...
关键词:论坛 结构化数据 信息抽取 WEB挖掘 
基于网页布局相似度的Web论坛数据抽取被引量:9
《中文信息学报》2010年第2期68-75,共8页王允 李弼程 林琛 
国家863计划资助项目(2007AA01Z439);信息工程大学学位论文创新基金资助项目(BSLWCX200802)
Web论坛中蕴含着丰富的信息资源,充分利用这些信息资源依赖于论坛数据抽取技术。该文解决了从Web论坛抽取什么数据和如何抽取的问题,提出了一种基于网页布局相似度的Web论坛数据抽取方法,有效弥补了目前方法的自动化程度低,或准确率低...
关键词:计算机应用 中文信息处理 WEB论坛 数据抽取 相似度 
Web论坛的线索树构建研究
《硅谷》2009年第24期67-67,共1页廉晶 郭文强 
目前,在线办公已经成为一种风尚,消费者对产品的评论也在以惊人的速度增长,因此对于消费者想买的产品很难读完所有相关的评论并且做出一个理性的决定。我们的任务是把消费者对某一产品的评价提取出来,并且判断它是积极的,消极的还是中...
关键词:线索树 语义挖掘 论坛 相似度 
基于平板型Web论坛的信息抽取研究被引量:9
《成都信息工程学院学报》2009年第1期1-4,共4页陈挺 刘嘉勇 夏天 范刚 
Web论坛信息抽取是Web论坛分析的预处理步骤。在舆情分析研究中,论坛帖子的各种属性是分析舆论话题演变的重要数据;由于平板型网络论坛页面的结构,使帖子的回复对象属性抽取较难实现。通过对平板型网络论坛结构及论坛用户网络发帖习惯...
关键词:信息抽取 平板型论坛 帖子回复对象 抽取规则 
检索报告 对象比较 聚类工具 使用帮助 返回顶部