百度的大数据实践  

在线阅读下载全文

作  者:李敏[1] 陈尚义[1] 林仕鼎[1] 

机构地区:[1]百度公司

出  处:《金融电子化》2013年第6期35-36,共2页Financial Computerizing

摘  要:互联网搜索引擎从第一天开始就是大数据应用,互联网产生了海量数据,如何从中找到需要的信息就是一个大数据的命题。搜索引擎正好解决这一问题,网络爬虫首先从数以千亿级的网页中搜集信息,建立网页数据库。当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户查询语句相符的网站,便采用排序算法——通常根据网页中关键词的匹配程度、出现的位置、频次、链接质量综合计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。

关 键 词:网页链接 百度 搜索引擎 数据应用 海量数据 网络爬虫 查询语句 匹配程度 

分 类 号:F49[经济管理—产业经济]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象