检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:艾赛提江.艾拜都拉
机构地区:[1]新疆大学信息科学与工程学院,新疆乌鲁木齐830008
出 处:《新疆教育学院学报》2004年第4期102-106,共5页Journal of Xinjiang Education Institute
摘 要:随着 Internet应用的逐步普及,WWW已成为一个巨大的分布式信息空间,为用户提供了一个极有价值的信息源。从而维文网站也逐步增长,但是因为维文字库编码还没有标准化,所以到目前为止还没有一个针对维文网站的比较实用的搜索引擎,这对维吾尔族用户在网上检索信息带来了极大的不便。本文通过讨论维文网上信息处理中的一些关键技术问题,提出了维文网站搜索引擎的 URL遍历、数据采集、查询服务三个核心技术模块的解决方案。With the increasing popularity of Internet ,WWW become a widely distribvted information space, providing the most valuable information resources. Thereby, the number of Uighur websites is increasing. But the codes of Uighur font has not been standardized yet. So there is not any applicable search engine for Uighur websites. It is inconvenient for Uighur users to find information on the internet. Through discussing some important technological aspects of Uighur information processing on the internet this paper bring forward a solution of three core modules that URL traversal, data acquisition, query, of search engine for Uighur websites.
关 键 词:URL遍历 数据采集 字体转换 HTML过滤 UNICODE
分 类 号:TP31[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229