基于维吾尔文的聚焦策略爬虫技术研究  

Study on Focused Crawler for Uyghur langange

在线阅读下载全文

作  者:阿依努尔.阿布瓦依提 

机构地区:[1]新疆师范大学信息管理中心,新疆乌鲁木齐830054

出  处:《新疆师范大学学报(自然科学版)》2014年第4期75-78,共4页Journal of Xinjiang Normal University(Natural Sciences Edition)

摘  要:随着网络资源的不断丰富,人们获取信息的途径已被网络代替。维吾尔文,在语言信息处理,WEB应用等领域有了迅速的发展。文章针对网络爬虫的工作原理以及聚焦爬虫策略进行阐述,在此基础上结合维吾尔语信息提取的相关研究,研究了维吾尔文的网络爬虫技术的结构和策略,从而为维吾尔文搜索引擎的网页数据库建设和维吾尔文网络舆情分析研究提供海量的语料。The way people getting various information have gradually been replaced by the vast growing Inter-net,along with rich online resources. as for this, Uyghur language have developed very fast in many research fields, in which natural language processing and Web application. This paper, mainly presented basic theory of web crawl-er and strategy of focused carawler, on the basis of study on Uyghur information extraction. Then discussed Uyghur web crawler in both structural and strategic way. Thus, massively provided large rage corpus for Uyghur search en-gine and Uyghur public network analysis.

关 键 词:网络爬虫 维吾尔文聚焦策略 维吾尔文搜索引擎 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象