中文信息

作品数:2472被引量:11029H指数:50
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:刘挺孙茂松郑家恒吴健俞士汶更多>>
相关机构:清华大学北京大学中国科学院中国中文信息学会更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划国家社会科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 基金=国家重点基础研究发展计划(2004CB318109)x
条 记 录,以下是1-10
视图:
排序:
一种新的情感词汇语义倾向计算方法被引量:21
《计算机研究与发展》2009年第10期1713-1720,共8页杜伟夫 谭松波 云晓春 程学旗 
国家"九七三"重点基础研究发展计划基金项目(2004CB318109);国家自然科学基金项目(60803085)~~
当前,人们越来越倾向于通过互联网(论坛、讨论组、博客)表达自己对事物的观点、意见.如何利用计算机自动、有效地挖掘这些信息是一个具有挑战性的问题,并且在企业智能分析、政府舆情分析等领域具有广阔的应用空间和发展前景.文本倾向分...
关键词:计算机应用 中文信息处理 态度分类 语义倾向 模拟退火算法 
一种面向流分类的特征选择算法被引量:1
《中文信息学报》2009年第3期51-57,94,共8页李文法 段洣毅 刘悦 孙春来 
863高技术研究发展计划项目(2006AA010105&2007AA01Z416);973国家重点基础研究发展计划项目(2004CB318109,2007CB311100)
流分类技术在网络安全监控,QoS,入侵检测等方面起着重要的作用。流分类器处理的数据含有大量的相关与冗余特征,这不仅增加了分类器的计算复杂性,同时也影响了分类器的分类效果。针对高维特征空间,特征选择一方面可以提高分类精度与效率...
关键词:计算机应用 中文信息处理 流分类 特征选择 快速模拟退火 决策树 
基于用户兴趣的寻找虚拟社区核心成员的方法被引量:14
《中文信息学报》2009年第2期89-94,122,共7页陈海强 程学旗 刘悦 
国家973计划资助项目(2004CB318109);国家863计划资助项目(2007AA01Z416)
发现虚拟社区中的核心成员对于社区数据挖掘等应用问题有着相当重要的应用价值。为解决该问题,作者首先分析了一些虚拟社区中成员的兴趣相似性分布情况,从中发现核心成员间的兴趣存在相对较高的相似性。据此,作者提出了基于兴趣集中性...
关键词:计算机应用 中文信息处理 虚拟社区 核心成员 兴趣相似性 
基于统计特征的垃圾博客过滤被引量:6
《中文信息学报》2008年第6期86-91,共6页刘玮 廖祥文 许洪波 王丽宏 
国家973课题资助项目(2004CB318109);国家863计划资助项目(2007AA01Z441)
该文根据垃圾博客和正常博客在统计特征上的差异,对多种针对博客分类有效的统计特征进行了分析,提出基于博客页面统计特征的过滤方法。在Blog06数据集上的实验表明,该方法的过滤准确性达到97%,比基于词频特征的过滤方法提高了约7%,在不...
关键词:计算机应用 中文信息处理 内容分析 垃圾博客过滤 统计特征 词频特征 泛化能力 
Web检索查询意图分类技术综述被引量:16
《中文信息学报》2008年第4期75-82,共8页张森 王斌 
国家自然科学基金资助项目(60603094);国家973课题资助项目(2004CB318109)
查询分类是近年来信息检索领域的研究热点,并且在很多领域得到了广泛地关注。主要讨论根据查询的意图进行分类的研究工作,从查询分类的诞生背景、关键技术、所使用的分类方法和评价方法方面进行综述评论,提出了查询意图分类面临的问题...
关键词:计算机应用 中文信息处理 自动查询分类 查询意图分类 分类方法 数据集 特征提取 机器学习 
文档检索中句法信息的有效利用研究被引量:4
《中文信息学报》2008年第4期66-74,共9页丁凡 王斌 白硕 刘宜轩 李亚楠 
国家973重点基础研究资助项目(2004CB318109);国家自然科学基金资助项目(60603094);北京市科技计划(D0106008040291)
利用词项依存关系来改进词袋模型,一直是文本检索中一个热门话题。已有的定义词项依存的方法中,有两类主要的方法:一类是词汇层次的依存关系,利用统计近邻信息来定义词项依存关系,另一类是句法层次的依存关系,由句法结构来定义词项依存...
关键词:计算机应用 中文信息处理 信息检索 词项依存 句法分析 词项近邻 
网络文本主题词的提取与组织研究被引量:14
《中文信息学报》2008年第3期64-70,80,共8页曾依灵 许洪波 白硕 
国家973“大规模文本内容计算”课题资助项目(2004CB318109)
网络信息的指数爆炸给人们获取与掌控信息带来了困扰,为了挖掘海量信息中的关键因子并以恰当的方式进行组织,本文设计了网络文本主题词提取和组织算法。该算法基于多级滤噪的切分词拼接,利用特定的噪音库与滤噪策略严格控制拼接过程,在...
关键词:计算机应用 中文信息处理 主题词提取 未登录词识别 切分词拼接 主题词聚类 
自动文摘评价方法综述被引量:12
《中文信息学报》2008年第3期81-88,共8页张瑾 王小磊 许洪波 
国家973计划“大规模文本内容计算”课题资助项目(2004CB318109)
评价是自动文摘领域长期关注的焦点,对自动文摘技术的发展起着积极的促进作用。本文首先介绍了自动文摘评价方法的应用背景和面临的困难;然后对自动文摘评价方法进行了简单介绍和评价;接着在了解国内外研究现状的基础上详细分析了文摘...
关键词:计算机应用 中文信息处理 文本挖掘 自动文摘 自然语言处理 多文档文摘 文摘评价方法 
改进的OPTICS算法及其在文本聚类中的应用被引量:29
《中文信息学报》2008年第1期51-55,60,共6页曾依灵 许洪波 白硕 
国家973资助项目(2004CB318109)
基于密度的OPTICS聚类算法以可视化的结果输出方式直观呈现语料结构,但由于其结果组织策略在处理稀疏点时的局限性,算法实际性能未能得到充分发挥。本文针对此缺陷提出一种有效的结果重组织策略以辅助稀疏点的重新定位,并针对文本领域...
关键词:计算机应用 中文信息处理 OPTICS算法 密度聚类 文本挖掘 
基于查询空间的分布式文档集合划分算法
《中文信息学报》2008年第1期56-60,共5页张刚 刘悦 程学旗 
973国家重点基础研究发展计划资助项目(2004CB318109,2007CB311100)
合理的文档集合划分能够有效的提高分布式信息检索的效果,本文针对分布式信息检索中的集合划分问题,提出了一种基于查询空间的文档集合划分算法。与传统的基于文档空间的划分算法相比,该算法从一种全新的角度看待和理解文档集合划分问题...
关键词:计算机应用 中文信息处理 分布式信息检索 文档集合划分 聚类 
检索报告 对象比较 聚类工具 使用帮助 返回顶部