陈苗

作品数:2被引量:20H指数:2
导出分析报告
供职机构:浙江工业大学更多>>
发文主题:非结构化数据抽取大数据表格文档MAPREDUCE更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《浙江工业大学学报》《计算机工程与科学》更多>>
所获基金:浙江省重大科技专项基金浙江省“钱江人才计划”更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-2
视图:
排序:
基于MapReduce的Bagging决策树优化算法被引量:8
《计算机工程与科学》2017年第5期841-848,共8页张元鸣 陈苗 陆佳炜 徐俊 肖刚 
浙江省重大科技专项(2014C01408);浙江省公益性技术项目(2017C31014)
针对经典C4.5决策树算法存在过度拟合和伸缩性差的问题,提出了一种基于Bagging的决策树改进算法,并基于MapReduce模型对改进算法进行了并行化。首先,基于Bagging技术对C4.5算法进行了改进,通过有放回采样得到多个与初始训练集大小相等...
关键词:决策树 BAGGING MAPREDUCE模型 大数据分析 准确性 
非结构化表格文档数据抽取与组织模型研究被引量:12
《浙江工业大学学报》2016年第5期487-494,共8页张元鸣 陈苗 陆佳炜 徐俊 肖刚 
浙江省钱江人才计划D类项目(QJD1302009);浙江省重大科技专项资助项目(2014C01408)
针对现有文档数据抽取方法无法抽取多值属性且灵活性不高的问题,提出了一种面向非结构化表格文档的数据抽取方法与组织模型.在分析文档结构特征和数据流特征的基础上,定义了数据流生成基本规则,给出了一个基于规则的数据抽取流程,包括...
关键词:非结构化表格文档 数据抽取 结构化数据模型 数据分析 
检索报告 对象比较 聚类工具 使用帮助 返回顶部