李晓黎

作品数:6被引量:320H指数:5
导出分析报告
供职机构:中国科学院计算技术研究所更多>>
发文主题:INTERNET数据采掘向量空间模型信息检索数据挖掘更多>>
发文领域:自动化与计算机技术文化科学更多>>
发文期刊:《中文信息学报》《计算机学报》《计算机研究与发展》《计算机科学》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-6
视图:
排序:
一种实现搜索引擎个性化服务的方法被引量:33
《计算机科学》2002年第1期23-25,共3页谭琼 李晓黎 史忠植 
1 引言随着Internet网上信息的剧增,人们在利用计算机检索信息时变得越来越困难.一方面是信息非常丰富,收到太多的信息却无从选择和消化;另一方面是信息迷失,人们难于找到自己真正所需的信息.
关键词:搜索引擎 个性化服务 INTERNET 信息检索 
基于支持向量机与无监督聚类相结合的中文网页分类器被引量:108
《计算机学报》2001年第1期62-68,共7页李晓黎 刘继敏 史忠植 
国家自然科学基金!(6 980 30 10 );国家"八六三"高技术研究发展计划!(86 3-5 11-946 -0 10 )资助
提出了一种将支持向量机与无监督聚类相结合的新分类算法 ,给出了一种新的网页表示方法并应用于网页分类问题 .该算法首先利用无监督聚类分别对训练集中正例和反例聚类 ,然后挑选一些例子训练 SVM并获得 SVM分类器 .任何网页可以通过比...
关键词:支持向量机 无监督聚类 中文网页分类器 INTERNET 机器学习 
用数据采掘方法获取汉语词性标注规则被引量:10
《计算机研究与发展》2000年第12期1409-1414,共6页李晓黎 史忠植 
国家自然科学基金资助!(项目编号 6 980 30 10 )
从数据采掘的角度对汉语文本词性标注规则的获取进行研究 .在满足用户规定的支持度向量的前提下 ,先从候选集模式中挑选出常用模式 ;然后采掘出具有高可信度的产生式规则 .该过程完全是自动的 ,而获取的规则在表达上是明确的 ,同时又是...
关键词:数据采掘 中文信息处理 汉语词性标注规则 
高维数据中有效的相似性计算方法被引量:4
《计算机研究与发展》2000年第10期1166-1172,共7页叶施仁 游湘涛 史忠植 李晓黎 
国家自然科学基金!(项目编号 6 980 3 0 10 );国家"八六三"高技术研究发展计划基金资助!(项目编号 86 3 -5 11-946 ;86 3 -818-0 7)
相似性的计算是 CBR和 k- NN等 L azy L earning研究中十分关键的问题 .研究了降低相似性计算代价的方法 ,并以 k- NN为例 ,介绍了基于部分特征的相似性算法和基于投影的相似性算法 ,它们能够通过减少计算距离过程中所涉及的特征数目来...
关键词:相似性 计算方法 高维数据 数据采掘 数据库 
概念推理网及其在文本分类中的应用被引量:57
《计算机研究与发展》2000年第9期1032-1038,共7页李晓黎 刘继敏 史忠植 
国家自然科学基金资助!(项目编号 6980 3 0 10 );国家"八六三"高技术研究发展计划基金资助!(项目编号 863 -5 11-946-0 10 )
在分析了当前文本分类中常用方法的基础上 ,提出了一种新的分类模型 .该模型是对人的分类过程的一种模拟 .在已有的英语语义词典及大量训练集的基础上 ,应用机器学习、数据挖掘等技术进行知识获取并最终形成若干个概念推理网 .对待分类...
关键词:文本分类 向量空间模型 概念推理网 机器学习 
文档中词语权重计算方法的改进被引量:120
《中文信息学报》2000年第6期8-13,20,共7页鲁松 李晓黎 白硕 王实 
973项目!(G19980 30 5 10 );国家自然基金!(6 97730 0 8);国家 86 3项目!(86 3- 30 6 - 2D0 2 - 0 1- 3)
文本的形式化表示一直是文本检索、自动文摘和搜索引擎等信息检索领域关注的基础性问题。向量空间模型 (VectorSpaceModel)中的tf.idf文本表示是该领域里得到广泛应用并且取得较好效果的一种文本表示方法。词语在文本集合中的分布比例...
关键词:文本表示 向量空间模型 词语分布比例 信息增益 
检索报告 对象比较 聚类工具 使用帮助 返回顶部