基于领域本体的网络爬虫  被引量:1

在线阅读下载全文

作  者:林春杰[1] 金苗娟 

机构地区:[1]洛阳师范学院信息技术学院,河南洛阳471000 [2]洛阳师范学院公共外语教研部,河南洛阳471000

出  处:《电脑编程技巧与维护》2020年第5期20-22,共3页Computer Programming Skills & Maintenance

摘  要:主题爬虫能够高效的获取特定主题的网页,是垂直搜索引擎核心技术之一。提出了一个基于领域本体的主题爬虫框架,借助基于领域本体的相关度计算方法预测链接主题的相关度和网页内容与主题的相关度,决定爬虫的下一步爬行路径,以便于尽可能缩小搜索路径。对比实验表明,提出的方法能够有效提高主题爬虫网页抓取的准确率和查全率。

关 键 词:领域本体 主题爬虫 链接分析 主题相关度 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术] TP393.092[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象