WEB文档

作品数:115被引量:352H指数:10
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:张福炎王麒钱旭王自强雷景生更多>>
相关机构:华中科技大学重庆大学复旦大学东南大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划教育部人文社会科学研究基金国家科技支撑计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机科学x
条 记 录,以下是1-4
视图:
排序:
基于事实抽取的Web文档内容数据质量评估被引量:5
《计算机科学》2014年第11期247-251,255,共6页韩京宇 陈可佳 
国家自然科学基金项目(61003040;61100135);中央高校基本科研业务费专项资金项目(LGZD201324)资助
Web文档内容数据质量评估决定获取数据的有用性。基于词法或用户交互进行质量评估的方法缺乏通用性,也不能获取内容的事实内涵。因此提出基于事实的质量评估方法(Fact-based Quality Assessment,FQA)。首先在Web上构建目标文档上下文,...
关键词:数据质量 WEB文档 准确性 完整性 质量维度 事实 
基于句子级最大频繁单词集的Web文档聚类研究被引量:1
《计算机科学》2007年第7期154-157,164,共5页路松峰 陈云开 袁莉 
Web文档聚类是Web挖掘的一个重要研究方向。现有的挖掘算法得到的频繁模式不仅维数高,而且不能很好反映文档表达的语义信息。为了得到更精确的聚类结果,本文提出一种基于句子级的最大频繁单词集挖掘方法来挖掘文档特征项。在此基础上,...
关键词:WEB文档聚类 粗糙集 关联规则 最大频繁单词集 
一种基于RPUC的Web文档索引库的更新算法被引量:1
《计算机科学》2004年第8期95-96,200,共3页熊海灵 伍胜 余建桥 李航 
国家自然科学基金(40731061);重庆市教委科学技术研究项目资助。
为提高搜索引擎文档索引库有效性验证的效率,本文提出了一种综合考虑网页更新频度、用户兴趣度及其内容重要程度诸因素相结合以确定文档索引库更新队列的算法。算法将用户的检索率、点击率、网页的 Page Rank 值和更新频度作为一个特征...
关键词:RPUC WEB文档 索引数据库 检索率 PAGE RANK 更新频度 点击率 
Web文档清洗技术被引量:3
《计算机科学》2002年第6期52-54,共3页张波 王继成 王强 张福炎 
国家自然科学基金(编号:600730307); 日本富士通研究所"Web文档清洗"项目
1引言 随着Internet在全球的迅速发展,WWW(World WideWeb)已经发展成为一个包含多种信息资源、站点遍布全球的巨大信息服务网络,为用户提供了一个极具价值的信息源,并已成为世界范围内信息共享和信息传播的最主要渠道之一.WWW系统一经出...
关键词:Web Internet WWW 信息资源 信息挖掘 文档清洗 计算机网络 信息检索 
检索报告 对象比较 聚类工具 使用帮助 返回顶部