吴信东

作品数:55被引量:772H指数:13
导出分析报告
供职机构:合肥工业大学更多>>
发文主题:家谱电子设备存储介质社交网络新闻网页更多>>
发文领域:自动化与计算机技术历史地理文化科学经济管理更多>>
发文期刊:《控制理论与应用》《计算机应用与软件》《小型微型计算机系统》《中国药理学通报》更多>>
所获基金:国家自然科学基金国家重点基础研究发展计划长江学者和创新团队发展计划国家高技术研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于内部知识扩展的软提示学习点击诱饵检测方法
《模式识别与人工智能》2024年第9期798-810,共13页董丙冰 吴信东 
国家自然科学基金项目(No.62120106008)资助。
点击诱饵的主要目的是通过引导用户点击链接以增加页面浏览量和广告收入.点击诱饵的内容往往具有低质量、误导性或虚假性的特征,对用户产生潜在不利影响.现有的基于预训练语言模型的提示学习方法依赖外部开放知识库以检测点击诱饵,不仅...
关键词:点击诱饵检测 软提示 内部知识扩展 提示学习 
HAO打卡系统:以组织智能成就智能组织
《软件学报》2024年第4期1914-1933,共20页吴信东 朱晓宇 董丙冰 嵇圣硙 卜晨阳 
国家自然科学基金(62120106008,91746209);中央高校基本科研业务费专项资金(JZ2020HGQA0186);教育部创新团队项目(IRT17R3)。
打卡可能出于私人目的,没有组织关联,比如记录个人的旅行日志;也可能是公事需求,属于组织考勤的一部分,有时还会与多个组织关联.因此,打卡数据的保存、分享和分析需要精细化管理.HAO打卡是一个移动式轻量级打卡平台,以个人和组织为两个...
关键词:HAO打卡系统 智能考勤 组织智能 决策支持 
数据中台框架与实践被引量:17
《大数据》2023年第6期137-159,共23页吴信东 应泽宇 盛绍静 蒋婷婷 卜晨阳 张赞 
国家自然科学基金资助项目(No.62120106008,No.91746209);中央高校基本科研业务费资助项目(No.JZ2023HGTB0270);教育部创新团队项目(No.IRT17R3)。
数据中台将一个机构(企业、事业或政府部门)的数据作为战略资产进行管理,是从数据收集到处理应用的一套管理机制,以期提高数据质量,实现广泛的数据共享,最终实现数据价值最大化。给出数据中台的定义,提出数据中台参考技术框架,并分别对...
关键词:数据中台 数据资产 数据治理 数字化转型 
基于复述模型的词语替代方法
《中文信息学报》2023年第5期22-31,43,共11页强继朋 陈宇 李杨 李云 吴信东 
国家自然科学基金(62076217,61703362);扬州大学“青蓝工程”资助项目。
词语替代任务旨在为句子中的目标词寻找合适的替代词。基于预训练语言模型BERT的词语替代方法直接利用目标词的上下文信息生成替代候选词。由于标注数据资源的缺乏使得研究人员通常采用无监督的方法,这也限制了预训练模型在此任务上的...
关键词:词语替代 复述模型 预训练模型 
自动词语简化方法综述被引量:2
《中文信息学报》2021年第12期1-16,共16页强继朋 李云 吴信东 
国家自然科学基金(62076217,61703362);江苏省自然科学基金(BK20170513);江苏省高校自然科学基金(18KJB120011)
自动词语简化是用简单、同等意义的词语替代句子中复杂词的过程,是文本简化中的一个重要研究方向。随着自然语言处理技术的快速发展,词语简化方法也在不断更新与变化。该文对词语简化方法的相关研究进行了梳理,先对词语简化的整体框架...
关键词:词语简化 复杂词识别 文本简化 预处理语言模型(BERT) 
碎片化家谱数据的融合技术被引量:7
《软件学报》2021年第9期2816-2836,共21页吴信东 李娇 周鹏 卜晨阳 
国家重点研发计划(2016YFB1000901);国家自然科学基金(91746209);教育部创新团队项目(IRT17R3)。
家谱数据是典型的碎片化数据,具有海量、多源、异构、自治的特点.通过数据融合技术将互联网中零散分布的家谱数据融合成一个全面、准确的家谱数据库,有利于针对家谱数据进行知识挖掘和推理,从而为用户提供姓氏起源、姓氏变迁和姓氏间关...
关键词:碎片化数据 数据融合 家谱数据 多源异构 HAO智能模型 
从知识图谱到数据中台:华谱系统被引量:28
《自动化学报》2020年第10期2045-2059,共15页吴信东 盛绍静 蒋婷婷 卜晨阳 吴明辉 
国家重点研发计划(2016YFB1000901);国家自然科学基金重点项目(91746209);教育部创新团队项目(IRT17R3)资助。
针对碎片化的各姓氏家谱数据,华谱系统通过构建家谱知识图谱的数据中台,能够解决数据孤岛、烟囱式开发等问题."数据中台"是一个源自国内的新近技术概念,在华谱系统建设中,我们通过家谱知识图谱的构建和应用,对这个概念进行了正式定义....
关键词:家谱建设 数据中台 数据治理 知识图谱 
数据治理技术被引量:188
《软件学报》2019年第9期2830-2856,共27页吴信东 董丙冰 堵新政 杨威 
国家重点研发计划(2016YFB1000901);国家自然科学基金(91746209);教育部创新团队项目(IRT17R3)~~
随着信息技术的普及,人类产生的数据量正在以指数级的速度增长,如此海量的数据就要求利用新的方法来管理.数据治理是将一个机构(企业或政府部门)的数据作为战略资产来管理,需要从数据收集到处理应用的一套管理机制,以期提高数据质量,实...
关键词:数据治理 数据规范 数据清洗 数据交换 数据集成 
一般间隙序列模式挖掘的关键词抽取被引量:3
《电子学报》2019年第5期1121-1128,共8页刘慧婷 刘志中 王利利 吴信东 
国家重点研发计划(No.2016YFB1000901);国家自然科学基金(No.61202227);安徽高校自然科学研究项目(No.KJ2018A0013)
本文提出了有监督的关键词抽取算法——KEING(Keyphrase Extraction using sequentIal patterns with oNe-off and General gaps condition)算法.首先,将每篇文档作为一个序列库,利用SPING(Sequential Patterns mIning with oNe-off and...
关键词:一般间隙 模式挖掘 关键词抽取 机器学习 
MapReduce与Spark用于大数据分析之比较被引量:77
《软件学报》2018年第6期1770-1791,共22页吴信东 嵇圣硙 
国家重点研发计划(2016YFB1000901);国家自然科学基金(91746209);教育部创新团队项目(IRT17R3)~~
评述了MapReduce与Spark两种大数据计算算法和架构,从背景、原理以及应用场景进行分析和比较,并对两种算法各自优点以及相应的限制做出了总结.当处理非迭代问题时,MapReduce凭借其自身的任务调度策略和shuffle机制,在中间数据传输数量...
关键词:大数据 MAPREDUCE SPARK 迭代问题 非迭代问题 
检索报告 对象比较 聚类工具 使用帮助 返回顶部