吴夙慧

作品数:7被引量:206H指数:4
导出分析报告
供职机构:南京大学信息管理学院更多>>
发文主题:K-MEANS算法初始聚类中心MEANS算法N元语法聚类更多>>
发文领域:文化科学自动化与计算机技术经济管理更多>>
发文期刊:《情报学报》《情报科学》更多>>
所获基金:教育部人文社会科学研究基金国家社会科学基金国家科技支撑计划中央级公益性科研院所基本科研业务费专项更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-7
视图:
排序:
链接分析研究进展被引量:5
《情报科学》2013年第4期155-160,共6页吴夙慧 孙建军 郑彦宁 潘云涛 
本文在近五年链接分析研究文献的基础上,对国内外链接分析的进展进行了评述,研究热点包括:基于网页内容的链接分析,基于用户行为的链接分析,基于Web网页群的链接分析、Web链接分析和复杂网络四个方面。文章最后探讨了链接分析研究的趋势。
关键词:链接分析 研究进展 复杂网络 
基于混合策略的中文生物医学领域未登录词识别研究被引量:2
《现代图书情报技术》2013年第1期15-21,共7页孙海霞 李军莲 吴英杰 吴夙慧 
国家"十二五"科技支撑计划项目"科技知识组织体系的协同工作系统和辅助工具开发"(项目编号:2011BAH10B02);中国医学科学院医学信息研究所基本科研业务专项"基于CMeSH的中文生物医学文献文本概念映射研究"(项目编号:10R0115)的研究成果之一
简述中文未登录词识别研究现状,结合中文生物医学领域词长分布和构词特点,提出以N-gram为基础,综合利用领域词典、语料和规则的中文生物医学领域未登录词识别方案,并以中国生物医学文献数据库中药学期刊数据作为样本集进行实验,效果表...
关键词:未登录词 N-GRAM 混合策略 生物医学 
一种基于引用上下文和引文网络的相关反馈算法被引量:3
《情报学报》2012年第10期1052-1061,共10页吴夙慧 成颖 郑彦宁 潘云涛 
国家社科基金项目“中文学术信息检索系统相关性集成研究”(项目批准号10CTQ027)、教育部人文社会科学研究规划基金项目“面向用户的相关性标准及其应用研究”(项目批准号07JA870006)及中国科学技术信息研究所合作研究项目的资助
相关反馈是一种根据用户或系统的相关性判断重构初始检索提问的方法,已被证明可以有效地改进检索效果。具体到学术文献,其引用关系表征了文献内容上的相关性,因而可以为相关反馈提供有价值的辅助信息。本文提出了一种基于引用上下文...
关键词:相关反馈 引用上下文 同被引 文献耦合 聚类 
文本聚类中文本表示和相似度计算研究综述被引量:23
《情报科学》2012年第4期622-627,共6页吴夙慧 成颖 郑彦宁 潘云涛 
国家社科基金项目(10CTQ027);教育部人文社会科学研究规划基金项目(07JA870006);中国科学技术信息研究所合作研究项目
围绕文本聚类中的文本表示和相似度计算两个基本的问题,对目前学界提出的文本表示方法和相似度计算方法进行了分类和较为全面的综述,将文本表示模型分为向量空间模型、语言模型、后缀树模型、本体等,相似度计算方法分为基于向量空间模...
关键词:文本聚类 文本表示 相似度计算 
基于学术文献同被引分析的K-means算法改进研究被引量:4
《情报学报》2012年第1期82-94,共13页吴夙慧 成颖 郑彦宁 潘云涛 
本文得到国家社科基金项目“中文学术信息检索系统相关性集成研究”(项目批准号:10CTQ027),教育部人文社会科学研究规划基金项目“面向用户的相关性标准及其应用研究”(项目批准号:07JA870006),中国科学技术信息研究所合作研究项目的资助.
K—means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题。本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K—means改进算法。该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被...
关键词:K—means算法 K值 初始聚类中心 同被引 文献聚类 
基于N元语法的英文学术文献聚类标签抽取算法被引量:4
《现代图书情报技术》2011年第7期68-75,共8页吴夙慧 成颖 郑彦宁 潘云涛 
国家社会科学基金项目“中文学术信息检索系统相关性集成研究”(项目编号:10CTQ027);教育部人文社会科学研究规划基金项目“面向用户的相关性标准及其应用研究”(项目编号:07JA870006);中国科学技术信息研究所合作研究项目的研究成果之一
提出一种基于N元语法的英文学术文献聚类标签抽取算法,该算法利用N元语法在大规模语料库上进行先期学习生成领域短语词表,再通过K-means算法进行聚类,从聚簇中抽取N元语法项计算TFIDF值,对出现在词表中的特征项赋以更高的权值,以得分最...
关键词:聚类标签 N元语法 学术文献聚类 
K-means算法研究综述被引量:168
《现代图书情报技术》2011年第5期28-35,共8页吴夙慧 成颖 郑彦宁 潘云涛 
国家社会科学基金项目"中文学术信息检索系统相关性集成研究"(项目编号:10CTQ027);教育部人文社会科学研究规划基金项目"面向用户的相关性标准及其应用研究"(项目编号:07JA870006);中国科学技术信息研究所合作研究项目的研究成果之一
对聚类分析中的基本算法K-means算法中的K值确定、初始聚类中心选择以及分类属性数据处理等主要问题进行综述,理清K-means算法的整个发展脉络及算法研究中的热点和难点,提出改进K-means聚类算法的思路。
关键词:K—means算法 聚类算法 K值 初始聚类中心 
检索报告 对象比较 聚类工具 使用帮助 返回顶部