数据清洗

作品数:1117被引量:4719H指数:32
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:王宏志于戈周傲英高宏刁兴春更多>>
相关机构:国家电网有限公司华北电力大学信息技术有限公司平安科技(深圳)有限公司更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划中国博士后科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于交通热线电话(12328)数据的道路运输领域分类指标研究
《新潮电子》2025年第7期190-192,共3页汪旗航 周炜 贾红 董轩 
本文针对道路运输领域的诉求数据,完成数据清洗、正则化和高精度分词等预处理步骤,确保数据的有效性和分析的可靠性;利用word2vec进行文本向量化,并通过BERTopic方法实现文本聚类,实现12328道路运输业务领域分类指标体系重构;利用基于B...
关键词:诉求数据 数据清洗 正则化 高精度 
基于DDQN的否定约束规则迁移
《深圳大学学报(理工版)》2025年第2期242-248,共7页秦建斌 杜玉琪 林毅斌 
国家重点研发计划资助项目(2021YFB3301500)。
传统的数据清洗方法因需专家手动定义数据质量规则,不仅复杂且耗时巨大,且清洗后的数据可能不能被重复利用,降低了数据清洗的质量和效率.为此,提出基于双重深度Q网络的否定约束迁移(double deep Q-network for denial constraints trans...
关键词:计算机技术 规则迁移 否定约束 相似度度量 强化学习 数据清洗 
基于Trie树查找和非关键词消除的中文机构名称归一化
《数据与计算发展前沿(中英文)》2025年第2期141-148,共8页赵静 姜树明 马启云 
山东省科技型中小企业创新能力提升工程(2023TSGC0135)。
【应用背景】在处理机构名称数据时,经常遇到机构名称不一致的问题。由于个体间的认知差异和主观偏好,同一机构可能会被赋予多个非规范名称。这些非规范名称通常基于普遍的认知常识、能够被广泛理解和接受,并且通常不会出现一个非规范...
关键词:归一化 非关键词消除 数据清洗 TRIE树 编辑距离查找 复核取优 
针对三维立体重建的无人机影像数据清洗方案研究
《湖南水利水电》2025年第2期32-35,38,共5页李德伟 李子钰 
近年来,随着民用无人机的普及,三维重建软件的智能化及3D打印技术门槛的不断降低,越来越多的人利用自己的设备与开源软件尝试建立模型。但由于无人机获取影像受天气、气流、光照、以及相机等多方面影响,在获取的影像数据集中存在少部分...
关键词:无人机影像 计算机视觉图像清洗 三维重建 MeshRoom 
基于改进LSTM的多时隙工业时序数据预测方法研究
《自动化仪表》2025年第4期86-91,共6页周红福 孙凯文 
在工业生产中,常常存在对仪器仪表数据进行趋势预测的需求。对长短期记忆(LSTM)神经网络作出改进,提出一种多时隙工业时序数据预测方法。首先,对输入端作出改进,使得模型能够预测多个采样周期后的数值。其次,对模型单元作出优化,提高了...
关键词:长短期记忆神经网络 深度学习 趋势预测 工业时序数据 滑动窗口 数据清洗 
自注意力优化密度聚类的风机数据清洗方法
《微特电机》2025年第4期34-38,共5页张茹顶 张铖 潘钱宇 李少帅 孟井煜枫 吴博阳 
针对风电机组监控与数据采集系统常受多种因素影响,导致数据异常问题,提出一种基于自注意力编码器改进的密度聚类模型方法,结合自注意力编码器的特征提取能力和密度聚类的空间特性,通过引入相对位置编码和优化多头注意力机制,提升对监...
关键词:自注意力编码器 密度聚类算法 数据清洗 监控与数据采集系统 风电机组 
基于大数据分析的医院分级诊疗系统设计
《自动化技术与应用》2025年第4期159-163,共5页柴秀花 赵健 
河北省医学科学研究课题计划项目(20211454)。
传统的医院分级诊疗系统对电子病历数据分析处理的时效性较差,且使用处理后的数据对病患进行转诊的准确性较差。为此,提出基于大数据分析的医院分级诊疗系统。优化医疗数据采集结果,并增加数据传感器。然后利用机器学习算法抽取分析原...
关键词:数据抽取 数据清洗 大数据分析 分级诊疗 医疗资源共享 医疗资源调用 
面向科研的临床结构化数据预处理方法研究
《医学信息学杂志》2025年第3期55-60,共6页车贺宾 何昆仑 吴欢 陈媛媛 王万玲 王飞 刘立永 尚亚飞 
新一代人工智能国家科技重大专项(项目编号:2021ZD0140406)。
目的/意义分析临床回顾性研究中结构化数据的主要问题和预处理技术,为临床数据预处理研究提供新思路。方法/过程基于中国人民解放军总医院多个医学中心10余年历史数据治理实践,梳理一套以数据融合、简约、清洗为主的预处理方法,并总结...
关键词:临床科研 数据预处理 数据清洗 
基于四分位数和Sigmoid改进模型的风电数据清洗方法
《电力科学与工程》2025年第3期55-62,共8页宫永立 王玉超 刘志文 陆旭峰 骆可 
新疆维吾尔自治区重大科技专项基金资助项目(2022A01007-6)。
风电机组实际运行工况复杂,导致所采集的风功率数据中存在大量异常点,不利于功率曲线准确拟合。为解决该问题,分析了风速-功率散点的分布特征、所有异常点产生原因及分布情况,并在此基础上应用了四分位法对稀疏异常点进行剔除。针对结...
关键词:风功率数据 四分位法 Sigmoid改进模型 目标函数 高斯牛顿法 LM优化算法 数据清洗 
基于MADM-QM的风电机组风功率异常数据处理方法
《可再生能源》2025年第3期339-345,共7页莫丰源 王卫华 郭前 
江苏省高等学校基础科学(自然科学)研究面上项目(23KJB510026)。
针对风电机组非正常运行时导致远程中央监控与数据采集(SCADA)系统所采集的风速-功率数据中存在大量的横向、纵向分布的异常值问题,文章提出了一种基于中值绝对偏差法(MADM)和四分位法(QM)的异常数据清洗方法,即MADM-QM算法。首先,基于...
关键词:风电机组 风功率 数据清洗 MADM-QM SCADA数据 
检索报告 对象比较 聚类工具 使用帮助 返回顶部