国家自然科学基金(60803080)

作品数:4被引量:14H指数:3
导出分析报告
相关作者:沈阳田晨耕沈劲枝寇文波刘扬更多>>
相关机构:武汉大学华中师范大学更多>>
相关期刊:《新闻与传播研究》《图书情报工作》更多>>
相关主题:信息抽取网页分析正文抽取正文档案采集更多>>
相关领域:自动化与计算机技术文化科学更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-4
视图:
排序:
基于特征定位边界预测的Web档案正文采集被引量:5
《现代图书情报技术》2009年第12期52-56,共5页沈劲枝 寇文波 田晨耕 
国家自科青年基金项目"反剽窃实现下的相似信息传播动力学"(项目编号:60803080);教育部人文社会科学研究青年项目"反剽窃理论与技术研究"(项目编号:08JC870010)的研究成果之一
提出基于特征定位边界预测的Web主题型页面的采集方法,以达到高速抽取互联网档案有效内容的目的。开发ROST CM、ROST TextExtractor两个软件工具构建训练集并进行测试。理论和实验表明,本算法适用于中文简体、繁体、英文网页,能够很好...
关键词:Web档案 档案采集 正文抽取 信息抽取 网页分析 
相关词句采集与分析研究被引量:1
《图书情报工作》2009年第22期40-43,共4页沈阳 朱婵元 周子轩 
国家自然科学青年基金项目"反剽窃实现下的相似信息传播动力学研究"(项目编号:60803080);教育部人文社会科学青年基金项目"反剽窃理论与技术研究"(项目编号:08JC870010)研究成果之一
针对目前互联网中相关词句集来源狭窄、没有对相关词的相关性判定公式进行多角度考虑和深层次理论分析等问题,实现相关词采集和分析原型,通过对相关词句集进行去重处理,并利用RSIS、RMRD和DDRW三种方法进行相关词重新排序。将相关词分...
关键词:相关词 相关性 元搜索引擎 排序算法 
网络转载传播实证分析与DSCCA模型研究被引量:4
《新闻与传播研究》2009年第4期16-21,共6页沈阳 王丽丽 刘晓兰 刘扬 
国家自然科学青年基金(60803080)"反剽窃实现下的相似信息传播动力学研究";教育部人文社科青年项目(08JC870010)资助;武汉大学大学生科研项目(S2008301)"数字出版软件网络营销实证分析"中期研究成果
网络文章的转载传播无处不在。本文利用自研的ROST Copy Check软件监控搜索引擎,连续一个月采集新浪名人博客、人民网新闻等五网站343篇文章共84674条转载记录,然后运用ROST Content Mining系统对数据集进行宏观结构测量和内容挖掘,通...
关键词:网络转载 传播状态 模型研究 实证分析 门户网站 MINING 网络文章 搜索引擎 
社会性人物搜索研究被引量:4
《图书情报工作》2009年第2期66-68,50,共4页沈阳 李舒晨 田晨耕 
国家自然科学青年基金项目"反剽窃实现下的相似信息传播动力学"(项目编号:60803080);教育部人文社会科学研究青年项目(项目编号:08JC870010)研究成果之一。
分析社会搜索和社会性人物搜索的相关研究,给出人物搜索和社会性人物搜索的定义、特点及一般流程,对近年来社会性人物搜索的热点事件分析,基于上述研究,进一步给出社会搜索的过程框架和工具软件,并完成第一阶段的软件开发,发布了ROST系...
关键词:社会搜索 人肉搜索 ROST 情报分析 社会计算 
检索报告 对象比较 聚类工具 使用帮助 返回顶部