检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国矿业大学计算机科学与技术学院,江苏徐州221008
出 处:《计算机工程与设计》2007年第9期2134-2137,共4页Computer Engineering and Design
摘 要:为了实现智能化搜索,基于知识库的启发式智能搜索引擎(KHISE)采用基于Web挖掘技术的聚焦爬行器采集信息;使用正则表达式、自然语言理解等技术抽取信息并用向量空间距离测度算法(VSM)对信息进行分类;使用启发式搜索等技术支持信息查询。信息收集、信息处理和信息查询3个模块既相互独立又相互关联。在实验室环境下实现的原型所得到的结果表明,研究设计的基于知识库的启发式智能搜索引擎不但提高了信息处理的效率和效果,还在很大程度上弥补了现有搜索系统的局限性。In order to make intelligence search put into effect, web mining technology is used in focused crawler to collect information, technologies of regular expressions and comprehension of nature language and so forth are used to extract information from web. Vector space model is also used for classification. Technology of heuristic search is adopted for searching. Information collecting, information processing and information search are independent and correlated. The result completed in lab shows that, the efficiency and effect of information processing are improved in knowledge-based heuristic intelligence search engine (KHISE), and the disadvantage of the current search system is avoided in a great degree.
关 键 词:智能搜索引擎 WEB信息抽取 WEB挖掘 自然语言理解 启发式搜索
分 类 号:TP39[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.127