陈跃国

作品数:17被引量:227H指数:7
导出分析报告
供职机构:中国人民大学更多>>
发文主题:大数据哈希日志数据知识库数据分片更多>>
发文领域:自动化与计算机技术文化科学更多>>
发文期刊:《软件学报》《计算机学报》《计算机教育》《大数据》更多>>
所获基金:国家自然科学基金中央高校基本科研业务费专项资金国家科技重大专项国家重点基础研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
数据科学导论课程建设与反思被引量:3
《计算机教育》2023年第2期64-67,73,共5页覃雄派 陈跃国 范举 
针对数据科学导论课程建设中的若干问题,包括该课程内容和后续其他课程内容的切割与衔接以及如何实现培养学生动手能力的教学目标等,提出在数据科学导论课程中对教学内容进行选讲和精讲,同时设计一系列示例、小练习和2个大作业,并给出...
关键词:数据科学 课程建设 
华为昇腾神经网络加速器性能评测与优化被引量:10
《计算机学报》2022年第8期1618-1637,共20页鲁蔚征 张峰 贺寅烜 陈跃国 翟季冬 杜小勇 
国家重点研发计划项目(2018YFB1004401);国家自然科学基金(U1711261,62172419);教育部产学融合协同育人(华为昇腾)项目资助.
华为昇腾是一款新型神经网络加速器.与GPU相比,昇腾加速器专门面向神经网络计算,设计了专用计算单元,核心算力集中在低精度,基于昇腾的软件栈与GPU有所差异.现有研究大多专注于GPU上的深度学习负载性能分析和优化,由于昇腾平台推出不久...
关键词:深度学习 神经网络加速器 华为昇腾 高性能计算 评测基准 
面向多核CPU和GPU平台的数据库星形连接优化被引量:4
《计算机应用》2021年第3期611-617,共7页刘专 韩瑞琛 张延松 陈跃国 张宇 
国家自然科学基金资助项目(61772533,61732014);北京市自然科学基金资助项目(4192066)。
针对联机分析处理(OLAP)中事实表与多个维表之间的星形连接执行代价较高的问题,提出了一种在先进的多核中央处理器(CPU)和图形处理器(GPU)上的星形连接优化方法。首先,对于多核CPU和GPU平台的星形连接中的物化代价问题,提出了基于向量...
关键词:联机分析处理 星形连接 向量化查询处理 向量压缩技术 异构计算 
意图知识图谱的构建与应用被引量:8
《大数据》2020年第2期57-68,共12页陈成 陈跃国 刘宸 吕晓彤 杜小勇 
国家自然科学基金资助项目(No.U1711261)。
政府治理的效果评估是一个难题。没有很好的评估方法和评估体系,政府治理的效果就不能得到很好的保障。提出从自然语言问答的角度理解网民在政府治理话题中的意图,并通过构建意图知识图谱,关联语义等价的问题和意图。不同意图又通过实...
关键词:意图理解 知识图谱 自然语言问答 实体识别 
HDFS存储和优化技术研究综述被引量:39
《软件学报》2020年第1期137-161,共25页金国栋 卞昊穹 陈跃国 杜小勇 
国家重点研发计划(2018YFB1004401);国家自然科学基金(U1711261,61432006,61732014)。
HDFS(Hadoop distributed file system)作为面向数据追加和读取优化的开源分布式文件系统,具备可移植、高容错和可大规模水平扩展的特性.经过10余年的发展,HDFS已经广泛应用于大数据的存储.作为存储海量数据的底层平台,HDFS存储了海量...
关键词:HDFS 分布式文件系统 存储系统优化 数据分析 
人在回路的数据准备技术研究进展被引量:7
《大数据》2019年第6期1-18,共18页范举 陈跃国 杜小勇 
国家自然科学基金资助项目(No.61602488,No.61632016,No.U1711261)~~
随着数据分析技术的迅猛发展,数据准备越来越成为一个瓶颈性问题。以真实的数据分析场景为背景,分析了数据准备的两大核心挑战:人力成本高与时间周期长。在此基础上,介绍了人在回路数据准备技术的研究进展。交互式数据准备技术面向终端...
关键词:数据治理 数据准备 众包 交互机制 
基于社区问答数据迁移学习的FAQ问答模型研究被引量:4
《华东师范大学学报(自然科学版)》2019年第5期74-84,共11页邵明锐 马登豪 陈跃国 覃雄派 杜小勇 
国家自然科学基金(U1711261,61432006)
基于FAQ(Frequent Asked Questions)问答技术构建智能客服系统,是当前业界普遍采用的技术方案.基于FAQ构建的问答系统,其返回的结果具有稳定、可靠、质量高的优点;但因受限于人工标注的知识库规模,识别能力有限,容易遇到瓶颈.为了解决FA...
关键词:迁移学习 深度神经网络 FAQ问答 
数据整理——大数据治理的关键技术被引量:47
《大数据》2019年第3期13-22,共10页杜小勇 陈跃国 范举 卢卫 
国家自然科学基金资助项目(No.U1711261)~~
数据是政府、企业和机构的重要资源。数据治理关注数据资源有效利用的众多方面,如数据资产确权、数据管理、数据开放共享、数据隐私保护等。从数据管理的角度,探讨了数据治理中的一项关键技术:数据整理。介绍了以数据拥有者和直接使用者...
关键词:数据整理 数据准备 数据治理 数据管理 
“数据科学概论”课程设计被引量:6
《大数据》2017年第6期102-111,共10页覃雄派 陈跃国 杜小勇 王伟娟 
大数据时代已经到来,为了挖掘大数据的价值,社会急需大量合格的数据科学家,数据科学家的培养是一个紧迫的问题。提出了三大课程群的课程体系建设思路,其中"数据科学概论"是数据科学课程群的导论和入门性质的一门课程。本课程通过案例对...
关键词:数据科学 课程群 数据科学概论 课程设计 
基于随机游走的实体类型补全方法被引量:1
《计算机学报》2017年第10期2352-2366,共15页张香玲 陈跃国 毛文祥 荣垂田 杜小勇 
国家自然科学基金(61472426;61402329)资助~~
伴随着大数据的大量涌现以及开放链接数据(LOD)等项目的开展,语义网知识库的数量激增,语义网知识库正在引起学术界和工业界越来越多的关注,在信息检索系统中起着重要的作用,如实体搜索和问答系统等.实体类型信息在信息检索中扮演着重要...
关键词:知识库 类型补全 图模型 随机游走 大数据 
检索报告 对象比较 聚类工具 使用帮助 返回顶部