主题爬行

作品数:31被引量:78H指数:4
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:左万利张玉芳熊忠阳王英王辉更多>>
相关机构:吉林大学西华大学重庆大学长春工程学院更多>>
相关期刊:《计算机系统应用》《北京工业大学学报》《福建电脑》《测绘与空间地理信息》更多>>
相关基金:国家自然科学基金吉林省科技发展计划基金国家教育部博士点基金教育部重点实验室开放基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机研究与发展x
条 记 录,以下是1-3
视图:
排序:
主题爬行中的隧道穿越技术被引量:11
《计算机研究与发展》2010年第4期628-637,共10页彭涛 孟宇 左万利 王英 胡亮 
国家自然科学基金项目(60903098;60973040);吉林省科技发展计划基金项目(20070533);教育部高等学校博士学科点专项科研基金项目(200801830021);吉林大学基本科研业务费交叉学科与创新项目(200810025);符号计算与知识工程教育部重点实验室资助项目(93K-17)~~
由于网络环境的复杂性和网页内容的多主题性,要想得到更多的特定主题相关网页,就要穿越那些主题不相关网页来获取更多的主题相关网页,即隧道穿越.将隧道穿越分为灰色隧道穿越和黑色隧道穿越.对于灰色隧道,在爬行过程中,将一个多主题Web...
关键词:主题爬行 灰色隧道穿越 黑色隧道穿越 网页分块 TARGET LENGTH 
基于质心向量的增量式主题爬行被引量:4
《计算机研究与发展》2009年第2期217-224,共8页王辉 左万利 王晖昱 宁爱军 孙志伟 满春雷 
天津科技大学引进人才科研启动基金项目(20080418);天津市高等学校科技发展计划基金项目(20071303);吉林省科技发展计划基金项目(20070533)~~
研究如何在一个网页内部进行有选择的爬行.使用TFIDF-2模型以及Max,Ave,Sum三个启发式规则分别计算文档特征权重和质心特征权重,在此基础上构建与根集文档相对应的质心向量,利用它作为前端分类器指导主题爬行.使用前后端分类器分别给Fro...
关键词:文档特征权重 质心特征权重 主题爬行 锚文本 质心向量 
一种基于质心与本体的文本分类方法被引量:3
《计算机研究与发展》2007年第z2期6-11,共6页王辉 左万利 袁华 
国家自然科学基金项目(60373099);教育部"符号计算与知识工程"重点实验室基金项目(93K-17)
针对传统的TFIDF模型计算根集(root set)文档特征权重的不适应性,提出了计算文档特征权重的新方法--TFIDF-2模型.另外,给出3种启发式规则用于获取根集文档的质心向量.通过计算文档与质心之间的相似度进行文本分类只是质心的一个初步应用...
关键词:质心 文本分类 TFIDF 主题爬行 本体 
检索报告 对象比较 聚类工具 使用帮助 返回顶部