崔晓晖

作品数:17被引量:85H指数:6
导出分析报告
供职机构:北京林业大学信息学院更多>>
发文主题:林业文本大数据量子关键词抽取更多>>
发文领域:自动化与计算机技术文化科学农业科学电气工程更多>>
发文期刊:《计算机教育》《农业机械学报》《计算机工程与应用》《中南林业科技大学学报》更多>>
所获基金:国家自然科学基金中央高校基本科研业务费专项资金黑龙江省自然科学基金黑龙江省博士后基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
提示学习研究综述
《计算机工程与应用》2024年第23期1-27,共27页崔金满 李冬梅 田萱 孟湘皓 杨宇 崔晓晖 
国家重点研发计划(2022YFF1302700);国家自然科学基金(82374621);林草智能信息技术创新研究项目(QNTD202308)。
经过微调的预训练语言模型在各领域任务中均取得了显著的性能。但是,预训练和微调之间在训练数据和目标函数方面存在着巨大差距,阻碍了预训练语言模型对下游任务的有效适应。提示学习的提出缩小了预训练和微调之间的差距,并可以很好地...
关键词:提示学习 预训练模型 预训练和微调 小样本学习 零样本学习 
超立方体在PMC模型下的h边容错1-好邻居条件诊断度
《信息系统工程》2021年第11期97-100,共4页孙俏 郑子豪 陈志泊 崔晓晖 
系统级诊断是多处理器系统故障诊断的一种重要方法,故障诊断能力是衡量多处理器系统可靠性的重要指标。在实际情况中,结点和链路都可能发生故障,衡量互连网络在混合故障下的诊断能力有h边容错t可诊断度,是指当故障链路不超过h时,系统能...
关键词:故障诊断 超立方体 PMC模型 h边容错1-好邻居条件诊断度 
森林生态站大数据快速存储与索引方法被引量:4
《农业机械学报》2021年第8期195-204,212,共11页王新阳 贾相宇 陈志泊 崔晓晖 许福 
中央高校基本科研业务费专项资金项目(BLX201923);国家自然科学基金项目(32071775)。
针对森林生态站中大量图像、视频、GIS数据等非结构化数据以及生态指标等结构化数据存储效率低、检索性能差的问题,提出了基于Hadoop和HBase的森林生态站大数据存储框架。基于所提出的框架,给出了森林生态数据存储业务流程,并对森林生...
关键词:森林生态 大数据 快速存储 数据索引 分布式平台 
基于注意力机制的林木物候期识别方法被引量:5
《中南林业科技大学学报》2021年第7期11-19,共9页崔晓晖 陈民 陈志泊 许福 王新阳 
国家自然科学基金项目(61772078,32071775)。
【目的】针对物候期识别传统方法特征提取不充分、未对关键特征进行区分,导致方法泛化能力较差、迁移应用识别精度低的问题,本研究将注意力机制引入残差神经网络,结合基于数字照相的物候观测方式,提出具有较强细粒度特征识别能力且实用...
关键词:物候期识别 深度学习 注意力机制 精准林业 
适用于矢量瓦片缓存替换的视点相关预测区域算法
《地理与地理信息科学》2021年第1期5-10,46,共7页王治铭 范光鹏 陈飞翔 崔晓晖 
国家重点研发计划项目(2017YFD0600906)。
传统的缓存置换策略未充分考虑数据访问的空间特征,也不适用于基于矢量瓦片的替换。该文根据矢量瓦片的空间数据结构,提出一种适用于矢量瓦片缓存替换的视点相关预测区域算法:首先根据瓦片存储中多分辨率金字塔结构进行空间单元划分,并...
关键词:矢量瓦片 矢量要素 预测区域 瓦片缓存价值 缓存策略 
基于TextRank和簇过滤的林业文本关键信息抽取研究被引量:15
《农业机械学报》2020年第5期207-214,172,共9页陈志泊 李钰曼 许福 冯国明 师栋瑜 崔晓晖 
国家自然科学基金项目(61772078);北京林业大学热点追踪项目(2018BLRD18)。
目前,获取林业文本关键信息存在2个问题:关键信息获取主要从关键词角度考虑,忽略了词语的信息类型;网络上的林业文本没有统一的记述结构,词语信息类型提取困难。为此,本文提出了基于改进TextRank和簇过滤的林业文本关键信息抽取方法,以...
关键词:林业文本 关键词抽取 TextRank 簇过滤 信息类型 
面向开源代码复用的程序比对分析方法被引量:2
《计算机工程》2020年第1期222-228,242,共8页许福 郝亮 陈飞翔 李冬梅 崔晓晖 
国家自然科学基金(61772078);北京市重点研发计划(D171100001817003)
开源代码复用是重要的软件开发模式,但开源许可证侵权与代码同步更新是当前开源代码复用中的2个主要问题。利用代码快照间的高度相似性特点,设计一种代码仓库的高效增量分析方法,在此基础上,利用Simhash算法将函数代码映射成函数指纹,...
关键词:开源软件 代码复用 增量分析 程序比对 代码溯源 
基于Spark框架XGBoost的林业文本并行分类方法研究被引量:11
《农业机械学报》2019年第6期280-287,共8页崔晓晖 师栋瑜 陈志泊 许福 
国家自然科学基金项目(61772078);北京林业大学热点追踪项目(2018BLRD18)
针对当前“互联网+”技术与林业的交叉融合,涌现出海量待挖掘的涉林文本,而林业文本分类的相关研究尚不成熟的问题,使用网络爬虫技术面向互联网采集涉林文本,基于丰富的语料重新构建分类标签,提出基于Spark计算框架的XGBoost并行化方法...
关键词:林业文本 文本分类 大数据分析 SPARK XGBoost 
基于改进Sequence-to-Sequence模型的文本摘要生成方法被引量:13
《计算机工程与应用》2019年第1期128-134,共7页周健 田萱 崔晓晖 
中央高校基本科研业务费专项基金(No.TD2014-02);中央高校基本科研业务费专项资金(No.BLX2014-27)
基于循环神经网络和注意力机制的Sequence-to-Sequence模型神经网络方法在信息抽取和自动摘要生成方面发挥了重要作用。然而,该方法不能充分利用文本的语言特征信息,且生成结果中存在未登录词问题,从而影响文本摘要的准确性和可读性。为...
关键词:文本摘要 Sequence-to-Sequence模型 语言特征 拷贝机制 Copy-Generator模型 
基于改进型果蝇算法的无性系种子园设计被引量:2
《农业机械学报》2018年第11期195-200,共6页齐建东 刘春霞 崔晓晖 李伟 
国家重点研发计划项目(2017YFC0504660;2017YFD0600500)
种子园的规划设计是林木育种的基础工作,在亲本数量不确定的前提下,最大限度避免种子园内无性系之间近交繁殖,保证种子园具有较高的遗传效益,是种子园设计的目标。以内蒙古红花尔基樟子松(Pinussylvestris var.mongolica)国家良种基地的...
关键词:种子园设计 无性系 果蝇算法 遗传距离 
检索报告 对象比较 聚类工具 使用帮助 返回顶部