检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]青海民族大学计算机学院,青海西宁810007
出 处:《软件工程》2017年第6期12-14,共3页Software Engineering
基 金:青海省科技厅(2016-ZJ-Y04)项目资助
摘 要:如今互联网上藏文信息也不断的扩充,藏文搜索引擎作为常用的信息检索的工具和渠道,倒排索引又是搜索引擎的核心技术之一,倒排索引直接影响搜索引擎检索的结果和响应的速度。之所以文章详细介绍了一个自主开发的藏文网页倒排索引系统,它以XML文档的标签内容作为索引对象,定义了文档和文档属性等概念,采用C#语言对文藏文网页正文构建倒排索引的关键技术和实现方法进一步的阐述,实现了基于XML文档的藏文网页倒排索引数据库的底层实现,提供了技术参考。利用这种方法藏文搜索引擎中信息检索的速度和准确率有所提高。As the Tibetan search engine is a commonly used information retrieval tool and channel,and inverted index is one of the core technology of search engines,inverted index directly affects the search results and response speed of the search engine.The paper introduces a self-developed Tibetan web page inverted index system,which uses the tag content of the XML document as the index object,defines the concept of the document and the document attribute,and constructs the inverted index of the text in C#Language.The key technology and the implementation method of the index are further elaborated,and the bottom implementation of the inverted index database based on the XML document is achieved,which provides technical reference for relevant research.Through this method,the efficiency and accuracy of information retrieval in Tibetan search engines have been effectively improved.
分 类 号:TP274[自动化与计算机技术—检测技术与自动化装置]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:13.58.121.29