检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:黄黎[1,2] 赵朋朋[1] 方巍[1] 崔志明[1] 孙振强
机构地区:[1]苏州大学智能信息处理及应用研究所,苏州215006 [2]江苏广播电视大学,南京210017 [3]南大苏富特科技有限公司,苏州215006
出 处:《计算机工程》2010年第8期60-63,共4页Computer Engineering
基 金:国家自然科学基金资助项目(60673092);江苏省科技支撑计划基金资助项目(BE2008044);2006年度江苏省"六大人才高峰"基金资助项目(06-E-037);2008年度江苏省高校研究生科研创新计划基金资助项目(CX08B_099Z)
摘 要:针对传统词袋方法在深网(Deep Web)数据源分类应用中的局限性,提出一种基于世界知识的Deep Web数据源增强分类模型,通过对外部知识库的主题分析,建立特征映射,构造基于领域概念的辅助分类器,丰富Deep Web查询表单的特征集合。基于Wikipedia百科知识库对真实Web数据进行分类。实验结果证明该模型有效。Bag of words method used in Deep Web sources classification shows many limitations.This paper proposes a novel Deep Web sources enhancing classification model based on world knowledge.It sets up the feature mappings by topic analysis of external knowledge,constructs an auxiliary classifier based on domain concepts,and enriches feature set of Deep Web forms.Experiment is performed based on Wikipedia encyclopedia,and experimental results verify this method is effective and scalable.
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15