主题爬行

作品数:31被引量:78H指数:4
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:左万利张玉芳熊忠阳王英王辉更多>>
相关机构:吉林大学西华大学重庆大学长春工程学院更多>>
相关期刊:《计算机系统应用》《北京工业大学学报》《福建电脑》《测绘与空间地理信息》更多>>
相关基金:国家自然科学基金吉林省科技发展计划基金国家教育部博士点基金教育部重点实验室开放基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
一种融合本体和最小二乘支持向量机的主题爬行方法被引量:2
《天津科技大学学报》2015年第3期72-77,共6页马永军 杨海波 
天津市科技支撑计划重点资助项目(12ZCZDGX02400)
针对现有的主题爬行方法存在收益率不高和不稳定的问题,融合本体和最小二乘支持向量机理论,提出一种主题爬行方法 Ontology-LSSVM.该方法将本体作为抓取主题的背景知识表示,得到一组主题相关概念的集合,再将其在网页文本中出现的词频作...
关键词:本体 支持向量机 主题爬行 收益率 食品安全 
一种基于主题爬行模式的地理信息分布式检索方法
《测绘与空间地理信息》2015年第4期96-97,101,共3页王小康 邓硕 吴博 李景文 
广西自然科学基金重点项目(2014GXNSFDA118032)资助
当前网络中地理信息以几何形式递增,为了高效地从海量网络信息中检索出高质量的地理信息,本文提出了一种基于主题爬行的地理信息分布式检索方法。本文采用面向对象的方法将网络地理数据按照四元组的要求进行分解和组织,对地物实体的主...
关键词:MAPREDUCE 主题爬行 地理信息 主题相关度 
基于复杂网络局部社团发现的主题爬行研究被引量:2
《河南师范大学学报(自然科学版)》2014年第4期134-138,共5页沈桂兰 孙洁 杨小平 
国家自然科学基金(71271209);北京市教委科技重点项目(SZ201311417001);北京市教委2014年科研基地项目(pxm2014_014209_07_000076)
从全局上限定采集范围可以有效地提高主题爬虫的查准率.结合Web链接分析和页面内容特征分析,提出了一种基于复杂网络局部社区发现的主题爬行方法,将主题爬行分为两个阶段,第一阶段采用复杂网络的局部社区发现算法进行Web链接分析,构建...
关键词:局部社区发现 主题爬行 主题网站群 相似度分析 
结合网页结构与文本特征的正文提取方法被引量:15
《计算机工程》2013年第12期200-203,210,共5页熊忠阳 蔺显强 张玉芳 牙漫 
国家自然科学基金资助项目(71102065)
网页中存在正文信息以及与正文无关的信息,无关信息的存在对Web页面的分类、存储及检索等带来负面的影响。为降低无关信息的影响,从网页的结构特征和文本特征出发,提出一种结合网页结构特征与文本特征的正文提取方法。通过正则表达式去...
关键词:正文提取 网页去噪 网页分块 主题爬行 信息检索 WEB挖掘 
主题搜索引擎中的高效网页分类器构建方法被引量:1
《科技通报》2013年第8期109-111,共3页李兆锋 
提出了一种基于领域本体的相似度计算与基于网页结构的特征向量抽取相结合的分类器构建方案,改进后的WF-TF/IDF模型根据网页各部分对于主题相关的重要程度进行权重分配,同时引用领域本体知识库,将网页与主题的相关程度评价转化为本体中...
关键词:主题爬行 网页分类器 本体 TF IDF 
基于多分类器组合择优方法的主题爬行分类策略
《图书情报工作》2013年第14期114-120,共7页乔建忠 
针对主题爬行技术中的单一分类算法在面对多主题Web抓取和分类需求时泛化能力不强的局限,设计一种利用多种强分类算法形成的分类器组合,主题爬行器根据当前主题任务在线评估并为分类器排名,从中选择最优分类器分类的策略,并开展在多个...
关键词:主题爬行技术 主题爬行器 网页分类 分类算法 多分类器组合 分类准确率 分类效率 
一种基于Lucene的面向主题爬行搜索引擎的研究被引量:1
《福建电脑》2013年第5期24-25,共2页严良达 
浙江工商职业技术学院科研基金项目:一种基于Lucene的面向主题爬行搜索引擎的研究
本文简要介绍了主题搜索的基本概念以及Lucene的基本结构。研究了面向主题搜索引擎的实现和优化,提出了JE中文分词实现方法,主题索引系统的构建,完成了一个高性能的主题搜索引擎系统。
关键词:LUCENE 面向主题 中文分词 索引 
基于ODP的上下文主题描述方法被引量:2
《电子学报》2012年第11期2320-2323,共4页吴麒 陈兴蜀 朱锴 王春晖 
国家科技支撑计划课题(No.2012BAH18B05);新媒体资源管理关键技术研究及原理系统
针对以往主题描述方法未充分考虑主题上下文的问题,提出了基于ODP(开放式分类目录)的上下文主题描述方法.使用新的特征选择算法对主题特征进行了确定,并使用分类主题树的上下文对主题描述方法进行优化以提高主题爬行的性能.实验表明,该...
关键词:主题爬行 下文相关 特征选择 主题描述 
一种启发式主题爬行算法
《世界科技研究与发展》2012年第5期723-725,共3页刘欣宇 唐学文 邓一贵 
为克服传统主题爬行器在爬行速度和主题预测精度上的不足,提高爬行器的查准率和查全率,根据当前常用主题爬行策略的特点,通过页面辐射空间的引入将主题策略中基于链接分析和基于内容分析的方法相结合,并嵌入启发式算法,提出一种基于启...
关键词:主题爬行 启发式算法 页面辐射空间 
基于信息增益的自适应主题爬行策略被引量:3
《计算机应用研究》2012年第2期501-503,共3页熊忠阳 史艳 张玉芳 
中央高校研究生科技创新基金个人项目(CDJXS11180014)
结合信息增益,提出了一种新的自适应主题爬行策略。利用维基百科的分类树和主题描述文档构建主题向量T,并在爬行过程中不断地进行自动学习,反馈更新主题向量空间中每个概念的权重,完善主题描述。实验结果表明,该方法具有增量爬行的能力...
关键词:主题爬行 维基百科 主题描述 自适应方法 信息增益 
检索报告 对象比较 聚类工具 使用帮助 返回顶部