广东省自然科学基金(07006474)

作品数:34被引量:193H指数:8
导出分析报告
相关作者:彭宏郑启伦胡建军马千里陈建超更多>>
相关机构:华南理工大学广东商学院广州市轻工职业学校暨南大学更多>>
相关期刊:《Chinese Physics B》《华南理工大学学报(自然科学版)》《微电子学与计算机》《佛山科学技术学院学报(自然科学版)》更多>>
相关主题:数据挖掘自然语言处理数据预处理基因表达式编程ETL更多>>
相关领域:自动化与计算机技术理学交通运输工程社会学更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于词性及词性依存的句子结构相似度计算被引量:6
《计算机工程》2011年第10期47-49,共3页蓝雁玲 陈建超 
广东省自然科学基金资助项目(07006474);广东省科技攻关基金资助项目(2007B010200044)
为提高句子相似度的准确率,从结构相似度出发,提出基于词性及词性依存关系的句子结构相似度计算方法。该方法从正向和逆向比较句子的词性序列,获得2个句子词性及词性依存关系的最优匹配,从而计算句子结构相似度。实验结果表明,该方法能...
关键词:句子结构 词性依存 结构相似度 自然语言处理 
受限领域中文问答系统问句分析研究被引量:1
《计算机工程与设计》2010年第11期2588-2591,共4页蒋昌金 彭宏 马千里 林正春 王成 
广东省自然科学基金项目(07006474);广东省科技攻关基金项目(2007B010200044)
问句分析是问答系统中一个极其重要的部分,它对后续的搜索模块和答案抽取模块有着至关重要的影响。为了提高问句分析模块的性能,对中文问答系统问句分析模块进行研究和分析,在构建领域词典的基础上实现了对问句中命名实体的识别。对问...
关键词:中文问答系统 问题分析 查询向量 查询扩展 信息检索 
面向数据质量的ETL框架的设计与实现被引量:20
《计算机工程与设计》2010年第9期2057-2060,共4页李庆阳 彭宏 
广东省自然科学基金项目(07006474);广东省科技攻关基金项目(2007B010200044)
针对传统抽取-转换-装载(ETL)架构在数据质量控制方面的不足,提出一种面向数据质量管理的ETL架构。根据ETL过程的特点,设计多数据源接口模块、ETL元数据描述模块、ETL任务描述模块和数据质量控制模块等。该架构以数据质量为核心,通过建...
关键词:数据仓库 数据质量 抽取-转换-装载(ETL) 规则推导 数据清洗 
基于增量词集频率的文本主题词提取算法研究被引量:5
《计算机应用研究》2010年第9期3237-3238,3246,共3页刘兴林 彭宏 马千里 
广东省自然科学基金资助项目(07006474,9451064101003233);广东省科技攻关资助项目(2007B010200044)
提出了一种基于增量词集频率的文本主题词提取算法,其核心思想是计算主题词集频率增量,算法从候选主题词集提取主题词时,计算单个候选主题词对主题词集频率的增量,若增量小于给定阈值,则主题词提取算法结束,否则将该候选主题词加入主题...
关键词:增量词集频率 主题词 自然语言处理 
用于网页目录构建的文本聚类算法
《计算机工程与设计》2010年第9期2002-2004,2088,共4页严桂夺 陈建超 
广东省自然科学基金项目(07006474);广东省科技攻关基金项目(2007B010200044)
为了提高网页目录的构建效率、增加其灵活性,提出了一种改进的文本聚类算法。改进的CBC算法用于快速确定文本的聚类中心,根据网页目录的特点,该算法增加了层次聚类方法,以形成文本类别的层次结构,考虑到网页文本的快速增长,采用增量方...
关键词:网页目录 文本聚类 特征向量 层次聚类 增量聚类 
基于主题词权重和句子特征的自动文摘被引量:17
《华南理工大学学报(自然科学版)》2010年第7期50-55,共6页蒋昌金 彭宏 陈建超 马千里 
广东省自然科学基金资助项目(07006474);广东省科技攻关项目(2007B010200044)
为获得高质量的自动文摘,在组合词识别算法的基础上,充分考虑词的频率、词性、词的位置、词长等因素,构建了一个词语权重计算公式,该公式能使表达主题的词和短语具有较高的权重.对句子权重的计算,则考虑了句子的内容、位置以及线索词的...
关键词:主题词 自动文摘 组合词 权重计算 句子特征 
基于局部重构与全局保持的半监督判别分析方法被引量:5
《华南理工大学学报(自然科学版)》2010年第7期45-49,55,共6页韦佳 杨创新 马千里 余国先 
广东省自然科学基金资助项目(07006474);华南理工大学中央高校基本科研业务费专项资金资助项目(2009ZM0189)
为克服线性判别分析(LDA)只能利用有标记样本的缺点,提出一种基于局部重构与全局保持的半监督判别分析(LRGPSSDA)方法.LRGPSSDA通过最小化局部重构误差来确定邻域图的边权值,在保持数据集局部结构的同时保持其全局结构,具有对邻域参数...
关键词:局部重构 全局保持 判别分析 半监督学习 
基于MVC架构的数据挖掘平台的设计与实现被引量:7
《计算机工程与设计》2010年第5期1013-1016,共4页叶苏南 彭宏 覃姜维 
广东省自然科学基金项目(07006474);广州市科技攻关基金项目(2007B010200044)
为了增强数据挖掘软件各功能模块的可扩展性和复用性,分析了现有数据挖掘工具的优缺点,并综合考虑数据挖掘过程的实际特点,提出了一个基于MVC架构的数据挖掘平台设计方案。在此基础上,利用Eclipse plug-in,RCP,GEF等技术,实现了一个数...
关键词:数据挖掘 软件复用 软件构件 ECLIPSE插件 富客户端平台 图形编辑框架 模型-视图-控制器 
中药复方配伍多维分析系统中数据库的设计被引量:2
《计算机工程与设计》2010年第4期911-914,共4页胡建军 
国家自然科学基金项目(60763012);广东省自然科学基金项目(07006474);广东省科技攻关基金项目(2007B010200044);广东商学院博士基金项目(07BS52002)
为了揭示中药复方配伍规律,开发了中药复方配伍多维分析系统。由于中药数据涉及大量自然、人文知识,在系统中需要处理这些错综复杂的关系,因此设计存储这些复杂数据的数据库是个挑战性的工作。给出了中药复方配伍多维分析系统的分析流程...
关键词:数据挖掘 数据库 数据预处理 中药信息化 中药配伍 
混合式的元数据管理系统研究被引量:1
《计算机工程与设计》2009年第15期3624-3626,3630,共4页杜楠 彭宏 
广东省自然科学基金项目(07006474);广东省科技攻关基金项目(2007B010200044)
提出了一种基于混合式技术的元数据管理系统。探讨了两种常用的元数据管理方式:集中式元数据管理和分布式元数据管理。详细分析了基于这两种元数据管理方式的混合模型的结构,并对系统中对象存储的作用以及对元数据服务器的结构和功能进...
关键词:混合式 元数据管理系统 元数据服务器 对象存储设备 元数据标准 
检索报告 对象比较 聚类工具 使用帮助 返回顶部