北京市自然科学基金(4011003)

作品数:37被引量:1016H指数:15
导出分析报告
相关作者:史忠植张国清何清贾自艳刘少辉更多>>
相关机构:中国科学院中国科学技术大学上海体育学院中国科学院研究生院更多>>
相关期刊:《系统工程理论与实践》《中文信息学报》《计算机学报》《系统仿真学报》更多>>
相关主题:数据挖掘人工智能支持向量机ROUGH集数据仓库更多>>
相关领域:自动化与计算机技术电子电信文化科学理学更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
使用KNN算法的文本分类被引量:100
《计算机工程》2005年第8期171-172,185,共3页张宁 贾自艳 史忠植 
国家自然科学基金资助项目(60173017;9010402);北京市自然科学基金资助项目(4011003)
介绍了数据挖掘的一个分枝——文本自动分类的相关技术,在对数据进行预处理的基础上,实现了K最近邻居分类算法,并结合实验结果对数据预处理在文本分类中的重要性进行了讨论。
关键词:数据挖掘 文本分类 KNN算法 向量空间模型 
基于冰山查询的网络流量关联规则挖掘被引量:2
《计算机工程》2005年第7期9-11,81,共4页秦亮曦 史忠植 
国家自然科学基金资助项目(90104021;60173017);北京市自然科学基金资助项目(4011003)
由于网络数据流量的急剧膨胀,人们迫切希望对流量数据进行更深层次的分析,以发现隐藏在数据中的知识。但传统的网络流量监测和分析系统无法完成这一任务。作者采用基于冰山查询的关联规则挖掘方法,对网络流量与各IP之间的联系进行关联分...
关键词:数据挖掘 关联规则 排序FP-树 冰山查询 网络流量 
SFPMax——基于排序FP树的最大频繁模式挖掘算法被引量:26
《计算机研究与发展》2005年第2期217-223,共7页秦亮曦 史忠植 
国家自然科学基金项目(90104021;60173017;60435010);北京市自然科学基金项目(4011003)
FP-growth算法是目前较高效的频繁模式挖掘算法之一 ,但将它用于最大频繁模式挖掘时却不能获得较高的效率 深入分析了造成低效的原因 ,提出了利用排序FP 树挖掘最大频繁模式的算法SFP- Max 算法的主要思想如下 :①基于排序FP 树 ;②利...
关键词:数据挖掘 关联规则 排序FP-树 最大频繁模式 
机器学习与网络信息处理被引量:3
《计算机工程与应用》2004年第33期189-191,共3页李嘉佑 何清 史忠植 
国家自然基金(编号:90104021;60173017;60073019);北京市重点自然科学基金(编号:4011003)资助
机器学习在网络信息处理中占有重要地位。GHunt是一个采用多项机器学习技术的网络信息智能获取与处理系统。首先,这一系统支持分布式的网络信息并行搜索与内容过滤;其次,采用机器学习技术,包括文本分类、聚类,文本概念抽取,从概念层次...
关键词:网络信息 机器学习 概念语义空间 分类 聚类 
基于概率统计技术和规则方法的新词发现被引量:28
《计算机工程》2004年第20期19-21,83,共4页贾自艳 史忠植 
国家自然科学基金资助项目60173017;90104021);北京市自然科学基金资助项目(4011003)
新词/短语的识别是自然语言处理、信息检索和机器翻译等领域的一项基础研究。该文分析了已有短语抽取技术,并结合汉语特点,提出了基于概率统计技术和规则方法相结合的概念抽取方法。该方法包括高效的“二元语法”统计模型、统计算法、...
关键词:新词发现 短语抽取 二元语法 语料库 
一种基于动态进化模型的事件探测和追踪算法被引量:59
《计算机研究与发展》2004年第7期1273-1280,共8页贾自艳 何清 张海俊 李嘉佑 史忠植 
国家自然科学基金项目 ( 90 10 40 2 1;60 173 0 17) ;北京市自然科学基金重点项目 ( 4 0 110 0 3 )
在大量分析网络新闻特点的基础上 ,借鉴Single Pass聚类思想 ,并结合新闻要素给出了一种基于动态进化模型的事件探测和追踪算法 该动态模型是基于新闻事件的生存特点提出的 ,包括 :基于时间距离的相似度计算模型、事件模板进化策略以及...
关键词:新闻事件 新闻专题 事件探测 事件追踪 聚类 
面向数据质量的ETL过程建模与实现被引量:23
《系统仿真学报》2004年第5期907-911,914,共6页贾自艳 黄友平 罗平 李嘉佑 秦亮曦 史忠植 
国家自然科学基金(60173017;90104021);北京自然科学基金(4011003)
为了给数据仓库提供高质量的数据,在数据装载到数据仓库之前必须经过数据的抽取-转换-装载(Extraction-Transformation-loading,ETL)这一系列的预处理工作。复杂性和可用性是制约ETL系统的两大基本问题。为解决这些问题,给出了ETL过程...
关键词:数据仓库 数据质量 抽取-转换-装载(ETL) 数据挖掘 数据清洗 
一种基于Rough集的层次聚类算法被引量:18
《计算机研究与发展》2004年第4期552-557,共6页刘少辉 胡斐 贾自艳 史忠植 
国家自然科学基金项目 (60 173 0 17;60 0 73 0 19;90 10 40 2 1);北京市自然科学基金重点项目(4 0 110 0 3 )
Rough集理论是一种新型的处理含糊和不确定性知识的数学工具 ,将Rough集理论应用于知识发现中的聚类分析 ,给出了局部不可区分关系、个体之间的局部不可区分度和总不可区分度、类之间的不可区分度、聚类结果的综合近似精度等定义 ,在此...
关键词:ROUGH集 聚类 不可区分度 综合近似精度 
基于效用模型的网络控制被引量:1
《计算机工程》2003年第15期3-4,7,共3页刘芳 张国清 
北京市自然科学基金重点项目(4011003)
近年来,国外的研究者开始尝试着将微观经济学研究方法引入网络控制,为这一领域问题的解决提供了崭新的思路。该文重点介绍微观经济学中的效用模型在接入控制、资源分配、拥塞计费和SLA管理中的应用,并指出当前网络控制存在的问题以...
关键词:网络控制 效用模型 微观经济学 
一种基于网络管理信息的安全系统设计与实现被引量:2
《计算机工程》2003年第16期54-56,共3页李仰耀 张国清 
北京市自然科学基金重点项目(4011003)
网络信息安全已成为互联网发展的最重要议题之一。网络信息服务不仅在数量上与日俱增,而且其传播方式也呈现出多样化。为方便有效地管制这些信息的传播,该文提出一个基于网络管理信息新思路实现的网络信息管制系统(NetCop),并详细描...
关键词:网络信息获取 信息安全 代理服务器 
检索报告 对象比较 聚类工具 使用帮助 返回顶部