主题爬虫设计与实现  被引量:8

Design and Implementation of Theme Crawler

在线阅读下载全文

作  者:郭世龙[1] 王晨升[1] 

机构地区:[1]北京邮电大学自动化学院,北京100876

出  处:《软件》2013年第12期107-109,共3页Software

摘  要:海量网页的存在及其数量的急速增长使得通用搜索引擎难以满足面向主题或领域的用户需求。本文研究的主题爬虫致力于收集主题相关信息,达到极大降低网页处理量的目的,本文给出了主题爬虫中url处理、文本信息处理、文本特征训练等全部设计流程。实验结果充分论证了其可行性与实用性,为进行主题搜索引擎设计和个性化推荐系统设计提供相关主题信息采集的良好基础。The paper show characteristics of temperature measurement based on DS18B20.Once the sign of temperature was detected, data was transmitted to chip microcomputer and show the result in LCD and adjust. In addition, the system was simulated by Protues software and flowtree. The scope is minus55 to 125, though the immeditate temperature detected and compared by the setted temperature, we can alter the current temperature.

关 键 词:主题爬虫 文本相似度 特征提取 文本排重 DS18B20 

分 类 号:TP212.9[自动化与计算机技术—检测技术与自动化装置]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象