近似网页

作品数:7被引量:23H指数:3
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:曹玉娟牛振东杨文忠程芃森安俊秀更多>>
相关机构:北京理工大学北京航天飞行控制中心湖南大学成都信息工程大学更多>>
相关期刊:《科学技术与工程》《软件学报》《中国索引》《微电子学与计算机》更多>>
相关基金:教育部“新世纪优秀人才支持计划”国家自然科学基金河南省科技攻关计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-7
视图:
排序:
在线社会网络中近似网页识别方法研究
《微电子学与计算机》2017年第2期141-144,共4页张莉 孙丽娜 郭峰 
河南省高等学校重点科研项目(教科技[2015]1120号)"现代化跟踪系统目标成像轨迹模拟研究"(16A520093);河南省科技厅科技攻关项目"基于WiFi的无线存储测试系统设计"(162102210367);河南省科技攻关项目"基于机器人视觉下的运动目标成像特征提取技术研究"
为了提高用户的网络体验和页面检索性能,提出一种基于核心词汇和语义匹配相结合的在线社会网络近似网页识别方法研究.首先从网页中提取特征核心词汇,对文档概念进行分类和合并,并建立相似度特征模型;基于相似度特征模型,构建特征向量,...
关键词:在线社会网络 近似网页 识别方法 
基于特征词群的新闻类重复网页和近似网页识别算法
《成都信息工程学院学报》2012年第4期374-379,共6页程芃森 安俊秀 
四川省科技厅软科学计划资助项目(2011ZR0058);成都信息工程学院自然科学与技术发展基金项目(CSRF201002)对本文的资助
新闻类网页是互联网上冗余信息的重灾区。冗余网页不仅会加剧搜索引擎的处理负担,并且会降低用户体验,因此有必要对互联网上的冗余新闻网页实施消重处理。该算法依据新闻报道的自然语法特点将一篇新闻报道分解到词,从7类词性类别中提取...
关键词:计算机应用 网页消重 词性分类 特征词群 
基于概念和语义网络的近似网页检测算法被引量:15
《软件学报》2011年第8期1816-1826,共11页曹玉娟 牛振东 赵堃 彭学平 
国家自然科学基金(60803050;60705022);新世纪优秀人才计划(NCET-06-0161)
在搜索引擎的检索结果页面中,用户经常会得到内容近似的网页.为了提高检索整体性能和用户满意度,提出了一种基于概念和语义网络的近似网页检测算法DWDCS(near-duplicate webpages detection based on concept and semantic network).改...
关键词:网页去重算法 小世界网络 近似网页 均方差 
一个基于特征向量的近似网页去重算法被引量:5
《中国索引》2009年第1期11-14,共4页曹玉娟 牛振东 彭学平 江鹏 
在搜索引擎的检索结果页面中,用户经常会得到内容相似的重复页面,它们中大多是由于网站之间转载造成的。为提高检索效率和用户满意度,提出一种基于特征向量的大规模中文近似网页检测算法DDW(Detect near—Duplicate Web Pages)。...
关键词:网页去重算法 特征向量 近似网页 支持向量机 
基于网页特征关键词的近似检测算法
《科学技术与工程》2009年第4期919-923,共5页闫亮 李先国 
针对海量web文本信息,利用从网页主题内容提取出来的特征关键词,在倒排索引基础上建立相似度计算模型。对一篇新入库的网页文档,利用所包含的关键词迅速缩小进行相似度计算的网页范围,提高计算效率。实验结果表明该算法是有效的,小规模...
关键词:近似网页 关键词 搜索引擎 网页消重 
一种基于关键词的近似网页检测算法被引量:3
《微计算机应用》2008年第2期41-45,共5页杜海刚 李先国 
针对海量Web文本信息,利用从网页主题内容提取出来的特征关键词,在倒排索引基础上建立相似度计算模型。对一篇新入库的网页文档,利用所包含的关键词迅速缩小计算范围,提高计算效率。实验结果表明该算法是有效的,小规模评测结果得到较好...
关键词:近似网页 搜索引擎 网页消重 
简报近似网页的一种检测算法
《微计算机应用》2006年第1期22-22,共1页杨文忠 彭曙蓉 
关键词:检测算法 网页 近似 WEB信息检索 搜索引擎系统 向量空间模型 检索效率 局限性 关键词 WWW 
检索报告 对象比较 聚类工具 使用帮助 返回顶部