特征串

作品数:33被引量:167H指数:6
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:尹延伟车万翔黄永光胡晓光刘挺更多>>
相关机构:电子科技大学东南大学北京神州绿盟信息安全科技股份有限公司深圳市腾讯计算机系统有限公司更多>>
相关期刊:《中文信息学报》《西南民族大学学报(自然科学版)》《广西大学学报(自然科学版)》《机械工业信息与网络》更多>>
相关基金:国家自然科学基金国家重点基础研究发展计划西北工业大学研究生创业种子基金教育部科学技术研究重点项目更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=中文信息学报x
条 记 录,以下是1-2
视图:
排序:
面向变异短文本的快速聚类算法被引量:17
《中文信息学报》2007年第2期63-68,共6页黄永光 刘挺 车万翔 胡晓光 
本文主要针对近些年来大量出现在聊天语言中和手机短信中的短文本,提出了一种快速有效的聚类算法。这些短文本由于具有不规范性和大量相似性等特点,我们称其为变异短文本。本文在原有的网页去重算法的基础上,根据变异短文本的特点,...
关键词:人工智能 模式识别 检索 特征串 聚类 
基于特征串的大规模中文网页快速去重算法研究被引量:41
《中文信息学报》2003年第2期28-35,共8页吴平博 陈群秀 马亮 
网页检索结果中 ,用户经常会得到内容相同的冗余页面 ,其中大量是由于网站之间的转载造成。它们不但浪费了存储资源 ,并给用户的检索带来诸多不便。本文依据冗余网页的特点引入模糊匹配的思想 ,利用网页文本的内容、结构信息 ,提出了基...
关键词:计算机应用 中文信息处理 特征串 模糊匹配 去重算法 冗余网页 
检索报告 对象比较 聚类工具 使用帮助 返回顶部