检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨海军 施敏 梁汝峰 蔡立志[3] Yang Haijun;Shi Min;Liang Rufeng;Cai Lizhi(Shanghai Internet Information Office, Shanghai 200030, Chin;Shanghai Lanquluan Network Technology Co. , Ltd. , Shanghai 201313, China;Shanghai Key Laboratory of Computer Software Testing and Evaluating, Shanghai 201112, China)
机构地区:[1]上海市互联网信息办公室,上海200030 [2]上海蓝全网络科技有限公司,上海201313 [3]上海市计算机软件评测重点实验室,上海201112
出 处:《计算机应用与软件》2018年第6期158-162,共5页Computer Applications and Software
摘 要:传统Web数据采集的网络蜘蛛模型无法持续高效采集移动客户端数据信息,满足不了现有的舆情行业获取飞速增长的移动客户端信息的迫切需求。针对移动客户端信息采集设置的诸多限制,提出基于多用户访问模型和多IP模型的采集方案。对采集程序进行调整改进,并针对采集效率进行测试和分析。测试结果基本满足现有的对新闻移动APP客户端信息采集的实时性和全面性的要求,达到实际应用的标准。Because the traditional Web data collection web spider model cannot continuously and efficiently collect mobile client data information and cannot meet the urgent needs of the existing public opinion industry to obtain the rapidly growing mobile client information,we proposed a scheme of collecting information based on network agents with multi browser and IP address for many of the limitations set by mobile clients for information gathering. We adjusted and improved the collection procedure and tested and analysed the acquisition efficiency. The test results basically meet the existing real-time and comprehensive requirements for news mobile APP client information collection,and reach the standards of practical application.
关 键 词:用户行为模型 移动客户端 信息采集 网络蜘蛛模型
分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15