李贵

作品数:39被引量:68H指数:4
导出分析报告
供职机构:沈阳建筑大学信息与控制工程学院更多>>
发文主题:WEBWEB数据抽取推荐系统数据抽取结构化数据更多>>
发文领域:自动化与计算机技术经济管理天文地球电子电信更多>>
发文期刊:《信息工程期刊(中英文版)》《科技资讯》《郑州大学学报(理学版)》《山东大学学报(理学版)》更多>>
所获基金:辽宁省自然科学基金国家自然科学基金住房和城乡建设部科学技术计划项目辽宁省博士科研启动基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
具有重叠集合约束的实体解析问题研究
《数据挖掘》2023年第2期107-116,共10页樊沁怿 李贵 李征宇 
本文研究了具有重叠集合约束的实体解析集合相似性连接问题。给定两个集合内元素为集合的集合以及一个常数c,找到数据集当中至少共享了c个共同元素的所有集合对。这一问题是许多领域诸如信息检索、数据挖掘和实体解析当中的基本操作。...
关键词:集合相似性 数据挖掘 信息检索 实体解析 算法复杂度 数据集 启发式算法 基本操作 
基于大数据的房地产行业风险预警模型研究——以沈阳市为例
《数据挖掘》2023年第2期117-134,共18页樊莹莹 李征宇 李贵 孙平 
互联网技术在这几十年中迅速发展,让我们的生活也产生了很大的变化。对于我国经济发展也产生着不可比拟的作用。正是在这样的时代背景下,各行各业所要面临的竞争也变得非常剧烈。在这样剧烈竞争的市场上,企业应该如何提高自己竞争力是...
关键词:房地产行业 我国经济发展 预警模型 房地产企业 大数据 互联网 情报预警 预警机制 
基于排名机制的领域Web网页发现
《数据挖掘》2022年第4期320-333,共14页王安涛 李征宇 李贵 
对很多Web数据集成应用来说,领域Web发现能力至关重要。从目前来看,现有的主题爬取策略依然有效,并随之产生了不少依据这些策略的主题爬虫,然而配置主题爬虫困难且费时,因此提出基于排名机制的领域Web网页发现算法,该算法在现有的主题...
关键词:WEB网页 主题爬虫 WEB数据集成 发现算法 爬取策略 发现策略 排名 准确率 
基于示例编程的层次模型到关系模型的数据转换
《数据挖掘》2022年第4期334-350,共17页周晓楠 李贵 李征宇 
将多个数据源中的数据结合起来并统一存储,建立数据仓库的过程是web数据集成中的一个重要步骤。数据集成通过数据转换从而达到集成,主要解决数据的分布性和异构性的问题。许多应用程序使用层次结构存储和传输数据,这种基于树结构的层次...
关键词:数据转换 层次模型 应用程序 层次结构 文档转换 示例学习 数据仓库 数据集成 
一种基于实例的数据转换方法
《数据挖掘》2022年第3期235-245,共11页薄凤羽 李贵 李征宇 韩子扬 曹科研 
Web中包含大量有用的信息,但由于它们是半结构化的,非专家用户在进行数据转换和集成时不能很好地利用。为此本文提出了一种基于实例的数据转换方法,用户只需要提供适当的输入–输出示例就可以得到所需的转换。首先,利用基于序列比对的...
关键词:数据转换 代码分析 半结构化 距离度量 信息熵 序列比对 相关函数 Web 
基于局部敏感哈希及模糊连接的实体解析算法
《数据挖掘》2022年第3期280-296,共17页樊沁怿 李贵 李征宇 
随着互联网技术的发展和应用,Web数据量越来越大,在Web数据集成中,实体解析作为其中的重要环节,其主要任务是将不同Web数据源中指向现实世界同一实体的记录识别出来。然而这些数据往往都来自于不同的数据源,存在着数据重复等问题。为了...
关键词:模糊连接 实体解析 集合相似性 局部敏感哈希 
Web数据集成中缺失数据处理方法研究
《数据挖掘》2021年第4期226-240,共15页袁辉英 李贵 李征宇 韩子扬 曹科研 
数据预处理是web数据集成中的一个重要步骤,修复缺失数据是数据预处理的重要组成部分。在web数据集成中修复缺失数据的关键问题是缺失点没有可直接提供参考的观察值,这导致用户不能使用估算和推理的方法,只能依靠有经验的用户或领域专...
关键词:数据预处理 WEB数据集成 候选子集 缺失点 信息熵 
一种基于树模型的关联实体解析方法
《数据挖掘》2021年第4期241-252,共12页王泽龙 李贵 李征宇 韩子扬 曹科研 
在大数据时代,Web数据呈现多样性和关联性,在实体解析(Entity Resolution)中体现为解析的数据集往往包含多个实体集,实体集之间具有关联关系。这种关系导致解析一个实体集的结果可以使另一个实体集的解析受益,这种具有关联关系的实体解...
关键词:关联实体 关联树 相似节点 相似树 实体解析 
基于反常项集的异常值处理算法
《数据挖掘》2021年第3期150-166,共17页崔晨 李贵 李征宇 韩子扬 曹科研 
异常值指的是数据中的噪声和不一致值。异常值检测与处理往往依赖于约束规则,通常的约束规则包括条件函数依赖、否定约束、编辑规则等。但对于特定领域,这些领域约束规则需要由领域专家制定,基于数据挖掘和机器学习算法,难以高效地发现...
关键词:异常值处理 数据清洗 模式挖掘 反常项集 
一种基于属性显著度的实体解析算法被引量:1
《数据挖掘》2021年第2期27-37,共11页褚良旭 李贵 李征宇 韩子扬 曹科研 
实体解析(ER)是数据集成和数据清洗的一个重要步骤。在领域数据清洗与集成中,实体中不同的属性通常能表现出不同的区分能力,计算并利用属性的区分能力能够提高记录相似度的精确度。目前实体解析的方法有采用基于字符串的记录相似度算法...
关键词:实体解析 属性显著度 二部图 随机游走 
检索报告 对象比较 聚类工具 使用帮助 返回顶部