盛振华

作品数:2被引量:4H指数:1
导出分析报告
供职机构:浙江大学计算机科学与技术学院更多>>
发文主题:WEB对象聚类算法细粒度词汇信息分布更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机研究与发展》《浙江大学学报(工学版)》更多>>
所获基金:国家自然科学基金浙江省科技计划项目浙江省重大国际科技合作项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-2
视图:
排序:
TrigSigs:一种有效的非结构化记录关联合并算法
《浙江大学学报(工学版)》2010年第12期2284-2290,2308,共8页吴羽 盛振华 寿黎但 陈刚 
国家自然科学基金资助项目(60603044;60803003);浙江省科技计划项目重大科技攻关资助项目(2006c11108)
为了解决从网络数据源提取的非结构化数据的处理问题,提出一种基于触发对的聚类算法TrigSigs,利用触发对挖掘非结构化数据中隐含属性间的关联关系作为辨别实体的标志.该算法能够聚集对辨别实体起到关键作用的特征组合,过滤噪音词汇,并...
关键词:记录关联合并 非结构化数据 触发对 属性关联度 信息分布集中度 
InfoSigs:一种面向Web对象的细粒度聚类算法被引量:4
《计算机研究与发展》2010年第5期796-803,共8页盛振华 吴羽 江锦华 寿黎但 陈刚 
国家自然科学基金项目(60603044;60803003);浙江省科技计划基金项目重大科技攻关项目(2006c11108);浙江省重大国际合作项目(2008C14060)~~
面向Web对象的细粒度聚类已经成为学术界研究的热点.然而现有大多数聚类模型只关注如何对文本内容或文章主题进行聚类,聚类结果粒度较粗,无法满足大规模网络信息检索的质量要求.针对上述挑战,充分挖掘Web文档中词汇间的树状概率层次关系...
关键词:WEB对象 词频序TFS 信息分布集中度 相似度直方图 记录簇 
检索报告 对象比较 聚类工具 使用帮助 返回顶部