刘四维

作品数:3被引量:10H指数:2
导出分析报告
供职机构:复旦大学更多>>
发文主题:长句网页去重算法网页去重HASH函数BLOOM_FILTER更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《微型电脑应用》更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-3
视图:
排序:
基于Bloom Filter的网页去重算法被引量:6
《微型电脑应用》2011年第3期48-51,6,共5页徐娜 刘四维 汪翔 倪卫明 
现在的互联网中存在网页重复的问题,这些问题将会使数据挖掘,搜索的复杂度加大。现有技术一些不足之处,针对互联网中的重复网页采用基于Bloom Filter的网页去重算法。使用了现有的网页去杂算法,对网页进行预处理,同时利用Bloom Filter...
关键词:BLOOM filter 网页去重 长句 HASH函数 
基于GPRS网络的流媒体自适应速率算法被引量:2
《微型电脑应用》2009年第9期14-16,28,共4页章轶 刘四维 夏勇明 钱松荣 
在研究GPRS网络特性的基础上,设计基于RTP/RTCP的流媒体自适应速率传输算法。此算法包括首发视频选择算法,丢包率预测算法,及自适应视频码率调整算法。最后算法仿真实验结果表明首发视频选择算法可以有效减少视频传输途中的切换次数;丢...
关键词:GPRS 自适应速率 RTP/RTCP 丢包率 
基于HTML标记和长句提取的网页去重算法被引量:2
《微型电脑应用》2009年第8期30-32,5,共3页刘四维 章轶 夏勇明 钱松荣 
提出了一种高效的算法来去除互联网上的重复网页。该算法利用HTML标记过滤网页中的干扰信息,然后提取出能表征一张网页的长句作为网页的特征。通过分析两张网页所共享长句的数量,来判断两张网页是否重复。该算法还利用红黑树对网页的长...
关键词:网页去重 页面去杂 长句 红黑树 
检索报告 对象比较 聚类工具 使用帮助 返回顶部