陕西省科学技术研究发展计划项目(2007K04-11)

作品数:10被引量:27H指数:4
导出分析报告
相关作者:钱建立欧阳辉禄乐滨吴广茂张薇更多>>
相关机构:空军工程大学西北工业大学陕西省科学技术信息研究所西安交通大学更多>>
相关期刊:《电子设计工程》《计算机工程与设计》《中国科技期刊研究》《情报杂志》更多>>
相关主题:元数据抽取搜索引擎特征相似度相似度开放存取更多>>
相关领域:自动化与计算机技术文化科学电子电信更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于C4.5的论文元数据抽取算法研究被引量:4
《计算机工程与设计》2010年第16期3708-3711,共4页欧阳辉 禄乐滨 钱建立 
陕西省科学技术研究发展计划基金项目(2007K04-11)
基于特征相似度的论文元数据抽取算法与传统的DOM树方法相比,提高了论文元数据的抽取成功率。但论文元数据的抽取效率却不高,而论文元数据的抽取与蜘蛛的论文爬取是同时进行的,对元数据的抽取有实时性要求,因此影响了论文数据量的增加...
关键词:元数据 抽取 决策树 C4.5 特征相似度 
BP神经网络在BD1定位技术中的应用研究被引量:1
《电视技术》2010年第S1期165-168,共4页乔明 刘守义 庞春雷 
陕西省科学技术研究发展计划项目(2007K04-11)
在分析北斗一号(BD1)定位特点的基础上,通过在西安丰镐东路实测大量数据,观测到BD1定位高程误差较大,难以满足用户需求。针对此类问题,采用BP神经网络的预测结果对BD1定位结果进行修正,以提高定位的精度。确定了神经网络的结构,采用实...
关键词:北斗一号 高程误差 BP神经网络 学习率 
基于个性化服务的相关性算法的研究
《电子设计工程》2010年第9期1-3,共3页王元直 卢潇 钱建立 欧阳辉 
陕西省科学技术研究发展计划资助项目(2007K04-11)
在介绍个性化服务的相关知识的基础上,通过个性化服务的技术来提高用户和系统的互动性,从而提高搜索的查准率。并针对当前搜索引擎查询的信息太多,用户查询效率不高等问题,研究个性化搜索,并结合用户兴趣度完善了向量空间模型,提出一种...
关键词:个性化服务 向量空间模型(VSM) 兴趣度 搜索引擎 查询 
基于加权相似度的相关性排序算法的研究被引量:2
《电子设计工程》2010年第7期49-50,共2页王元直 卢潇 钱建立 
陕西省科学技术研究发展计划项目(2007K04-11)
通过研究当前搜索引擎检索信息的不足之处发现,要想提高查准率必须提高相似度,相似度越高,查准率就越高。主要研究语句相关度的相关知识,通过元数据的检索,计算检索的相似度。在此基础上,进一步结合论文元数据之间关系的相互对比,对各...
关键词:相似度 数据 搜索引擎 元数据检索 加权相似度 
基于SVM的论文元数据抽取方法研究被引量:6
《电子设计工程》2010年第5期4-7,共4页欧阳辉 禄乐滨 
陕西省科学技术研究发展计划项目(2007K04-11)
通过分析多分类支持向量机(SVM)的特点,建立了基于平衡二叉树的支持向量机模型BBT-SVM,并在训练过程中调整相关参数,得到目标支持向量机。针对PDF文件的特点,应用pdfbox开源库对PDF文件进行解析,去除PDF文件的文件头、交叉引用表以及文...
关键词:元数据抽取 支持向量机(SVM) 多类分类 平衡二叉树 
基于证据理论的论文元数据抽取算法研究被引量:3
《电子设计工程》2010年第4期66-69,共4页欧阳辉 禄乐滨 
陕西省科学技术研究发展计划项目(2007K04-11)
针对PDF文件的特点,应用pdfbox开源库对PDF文件进行解析,去除PDF文件的文件头、交叉引用表以及文件尾等额外的文档描述信息得到目标信息。在研究不确定性理论的基础上,确定初始证据各种特征的可信度计算方法,通过推理网络及证据理论的...
关键词:元数据抽取 不确定性 证据理论 
开放存取期刊网站结构和页面分类研究被引量:4
《情报杂志》2009年第7期137-140,117,共5页钱建立 刘军兰 张薇 
陕西省科学技术研究发展计划项目"科技论文开放获取搜索引擎研究"(编号:2007K04-11)
通过对国内外20种期刊网站结构和页面内容的分析,总结出期刊网站的Surface、聚类、树形、干扰4种特性,把期刊网站页面分为卷期索引、期目录、论文元数据、全文4类页面,分析了不同页面种类之间的组合变化,提出了基于页面分类的OA主题蜘...
关键词:开放存取 网站结构 页面分类 主题蜘蛛 
电子信息领域OA资源综述
《中国科技期刊研究》2009年第3期404-407,共4页钱建立 吴广茂 
陕西省科学技术研究发展计划项目:科技论文开放获取搜索引擎研究;编号2007K04-11
把OA资源分为了Post-Print、Pre-Print和金色OA、绿色OA,对目前支持论文检索的国内外电子信息领域的OA资源的主办单位、收录论文数、特点进行了比较,并给出了一些站点输入关键词"Filter"查到的论文数。结果表明,在计算机领域,Citeseer...
关键词:开放存取 预印本 OA仓储 知识库 比较 电子信息领域 
基于特征相似度的科技论文元数据提取算法研究被引量:9
《微电子学与计算机》2008年第8期129-132,共4页钱建立 吴广茂 蒋路 
陕西省科学技术研究发展计划项目(2007K04-11)
通过对论文元数据网页的分析发现论文摘要页面的各种元数据在长度、前置引导词、分隔符等方面都具有特定的规律,并据此提出了基于元数据特征的元数据抽取算法,归纳出了论文元数据的7个形式特征和2个语义特征,定义了确定特征和排除特征,...
关键词:元数据抽取 特征相似度 形式特征 语义特征 确定特征 排除特征 最大相似度原则 
Paperopen中的OA论文垂直蜘蛛设计
《情报杂志》2008年第6期60-63,共4页钱建立 吴广茂 张薇 孙滔 
陕西省科学技术研究发展计划项目“科技论文开放获取搜索引擎研究”(编号:2007K04-11)
描述了Paperopen项目中OA期刊论文蜘蛛的总体设计方案、蜘蛛调度机制、论文全文文件命名原则、数据库设计以及页面爬取和蜘蛛调度需要注意的问题,提出通过插件技术可解决一些杂志社网站存在的论文全文链接转向问题。Paperopen采用deep ...
关键词:开放阅读 搜索引擎 垂直蜘蛛 论文仓储 
检索报告 对象比较 聚类工具 使用帮助 返回顶部