江苏省“六大人才高峰”高层次人才项目(06-E-037)

作品数:9被引量:16H指数:3
导出分析报告
相关作者:崔志明方巍赵朋朋胡鹏昱黄黎更多>>
相关机构:苏州大学江苏省计算机信息处理技术重点实验室江苏广播电视大学江苏省现代企业信息化应用支撑软件工程技术研究开发中心更多>>
相关期刊:《计算机工程与应用》《微电子学与计算机》《计算机应用与软件》《计算机应用研究》更多>>
相关主题:深网数据源查询接口DEEP_WEBDEEP更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-9
视图:
排序:
基于主题概念实现对购物网站的自动主题分类
《计算机应用与软件》2010年第9期9-10,45,共3页陈洪平 方巍 黄黎 崔志明 
国家自然科学基金项目(60673092);2008年江苏省重大科技支撑与自主创新项目(BE2008044);2006年度江苏省软件和集成电路业专项经费项目([2006]221-41);2006江苏省"六大人才高峰"项目(06-E-037)
基于传统的关键词统计的分类方法难以正确识别网页的主题,从而难以实现按主题进行分类。为了有效地对Web上的结构化数据源进行主题分类,结合语义知识,将基于概念的主题分类方法,应用到网络购物网站数据源的自动主题分类中。实验表明,该...
关键词:本体 主题 网页分类 
基于世界知识的深网数据源增强分类模型被引量:1
《计算机工程》2010年第8期60-63,共4页黄黎 赵朋朋 方巍 崔志明 孙振强 
国家自然科学基金资助项目(60673092);江苏省科技支撑计划基金资助项目(BE2008044);2006年度江苏省"六大人才高峰"基金资助项目(06-E-037);2008年度江苏省高校研究生科研创新计划基金资助项目(CX08B_099Z)
针对传统词袋方法在深网(Deep Web)数据源分类应用中的局限性,提出一种基于世界知识的Deep Web数据源增强分类模型,通过对外部知识库的主题分析,建立特征映射,构造基于领域概念的辅助分类器,丰富Deep Web查询表单的特征集合。基于Wikipe...
关键词:深网 数据源分类 主题分析 特征映射 世界知识 
复杂Web页的Wrapper自动化生成技术研究
《微电子学与计算机》2010年第4期62-65,共4页陈洪平 方巍 李林 崔志明 
国家自然科学基金项目(60673092);江苏省重大科技支撑与自主创新项目(BE2008044);江苏省"六大人才高峰"项目(06-E-037)
针对基于模板生成Web页的基本特点,结合Ontology知识,探索Deep Web垂直搜索中,复杂Web页面的Wrapper自动化生成的解决方案.对实际复杂Web页面抽取的实验结果表明,该方法达到了较高的抽取准确率.
关键词:本体 数据抽取 包装器 
基于领域样本查询的Deep Web数据库分类被引量:1
《微电子学与计算机》2010年第3期20-23,共4页鲜学丰 赵朋朋 辛洁 方巍 崔志明 
国家自然科学基金项目(60673092);江苏省重大科技支撑与自主创新项目(BE2008044);江苏省"六大人才高峰"项目(06-E-037);江苏省研究生创新计划项目(CX08B_099z)
提出了一种基于领域样本查询的方法以分类这类Web数据库.通过分析领域的高级查询接口自动获取领域主属性并使用领域知识为主属性构建查询样本,然后对查询接口提交试探查询,根据返回结果页面的结果模式和记录内容估计Web数据库与领域的...
关键词:DEEP WEB WEB数据库 数据库分类 简单查询接口 
基于属性高频字的深网数据库重叠率估计被引量:3
《计算机工程》2009年第13期28-30,共3页苗忠义 赵朋朋 胡鹏昱 崔志明 
国家自然科学基金资助项目(60673092);2005年度教育部科研基金资助重点项目(205059);2006年江苏省"六大人才高峰"基金资助项目(06-E-037);2006年度江苏省软件和集成电路业专项经费基金资助项目([2006]221-41);2007年度江苏省研究生创新计划基金资助项目(cx07b-122cz)
在同一领域中,不同Web数据库之间有重叠部分,为估计重叠部分在Web数据库中所占比例,提出一种基于属性高频字的重叠率估计方法。以中文高频字作为起点,迭代诱导属性高频字。通过属性高频字的查询结果计算重叠部分出现的条件概率,进而估...
关键词:重叠率 深网 数据库 估计 
深网数据源质量估计模型被引量:7
《计算机工程》2009年第9期204-207,共4页胡鹏昱 赵朋朋 方巍 崔志明 
国家自然科学基金资助项目(60673092);2005年度教育部科研基金资助重点项目(205059);教育部高校博士学科点科研基金资助项目(20040285016);2006年江苏省"六大人才高峰"基金资助项目(06-E-037);江苏省2007年度研究生创新计划基金资助项目(CX07B-122Z)
为从海量深网中获得有价值的信息,提出一种深网数据源质量估计模型,综合考虑接口查询能力、接口页面质量和服务质量3方面因素,采用SVM和Ranking SVM机器学习方法得到质量估计函数。实验结果表明,该估计函数得到的数据源质量排序序列和...
关键词:深网 查询能力 查询接口 服务质量 
用Capture-Recapture方法估计Web数据库大小
《计算机应用研究》2009年第5期1754-1756,1759,共4页苗忠义 胡鹏昱 崔志明 
国家自然科学基金资助项目(60673092);2005年度国家教育部科研重点项目(205059);2006年江苏省"六大人才高峰"项目(06-E-037);2006年度江苏省软件和集成电路业专项经费资助项目([2006]221-41)
为了估计网络数据库的大小,提出了基于Capture-Recapture过滤二字亲密、二字排斥的方法。通过在接口文本框提交属性高频字,利用返回的结果集,在两两之间作交集,根据交集中的两字分布分析采样的独立性,过滤掉其中不独立的情况,再利用Capt...
关键词:大小估计 深网 网络数据库 
结构化信息的去重方法被引量:3
《计算机工程》2009年第3期23-25,28,共4页李林 刘桂峰 赵朋朋 崔志明 
国家自然科学基金资助项目(60673092);2005年度教育部科研基金资助重点项目(205059);2006年江苏省"六大人才高峰"基金资助项目(06-E-037);2006年度江苏省软件和集成电路业专项基金资助项目([2006]221-41);2007年度江苏省研究生创新计划基金资助项目(CX07B-122z)
针对载有结构化信息的网页,提出一种基于学习的去重方法。通过先期准备的样本定义分类器,根据分类器对页面中结构化信息的不同属性字段进行分类和距离计算,计算出整个信息对象和已分类样本信息的距离,以这些距离与阈值的大小关系判断该...
关键词:相似性测度 去重 聚类 
基于最大熵分类器的Deep Web查询接口自动判定被引量:1
《计算机工程与应用》2008年第21期133-137,共5页方巍 黄黎 崔志明 
国家自然科学基金( the National Natural Science Foundation of China under Grant No.60673092);2005年度教育部科研重点项目(the Key Project of Chinese Ministry of Education under Grant No.205059);2006 年江苏省“六大人才高峰”项目( the“Six Talent Peak”Project of Jiangsu Province under Grant No.06-E-037);2006 年度江苏省软件和集成电路业专项经费项目(the Specialized Fund Pro-ject for the Software and IC of Jiangsu Province in 2006 under Grant No.[2006]221- 41);2007 年江苏省重点实验室开放基金项目(theProject of Jiangsu Key Laboratory of Computer Information Processing Technology)
Web中包含着海量的高质量信息,它们通常处在网络深处,无法被传统搜索引擎索引,将这样的资源称为Deep Web。因为查询接口是Deep Web的唯一入口,所以要获取Deep Web信息就必须判定哪些网页表单是Deep Web查询接口。由于最大熵模型可以综...
关键词:DEEP Web 网页表单 特征提取 最大熵模型 
检索报告 对象比较 聚类工具 使用帮助 返回顶部