基于XML文档的藏文网页倒排索引的研究与实现  被引量:2

Research and Implementation of Inverted Index of Tibetan Web Pages Based on XML Documents

在线阅读下载全文

作  者:扎西拉旦 安见才让[1] 

机构地区:[1]青海民族大学计算机学院,青海西宁810007

出  处:《软件工程》2017年第6期12-14,共3页Software Engineering

基  金:青海省科技厅(2016-ZJ-Y04)项目资助

摘  要:如今互联网上藏文信息也不断的扩充,藏文搜索引擎作为常用的信息检索的工具和渠道,倒排索引又是搜索引擎的核心技术之一,倒排索引直接影响搜索引擎检索的结果和响应的速度。之所以文章详细介绍了一个自主开发的藏文网页倒排索引系统,它以XML文档的标签内容作为索引对象,定义了文档和文档属性等概念,采用C#语言对文藏文网页正文构建倒排索引的关键技术和实现方法进一步的阐述,实现了基于XML文档的藏文网页倒排索引数据库的底层实现,提供了技术参考。利用这种方法藏文搜索引擎中信息检索的速度和准确率有所提高。As the Tibetan search engine is a commonly used information retrieval tool and channel,and inverted index is one of the core technology of search engines,inverted index directly affects the search results and response speed of the search engine.The paper introduces a self-developed Tibetan web page inverted index system,which uses the tag content of the XML document as the index object,defines the concept of the document and the document attribute,and constructs the inverted index of the text in C#Language.The key technology and the implementation method of the index are further elaborated,and the bottom implementation of the inverted index database based on the XML document is achieved,which provides technical reference for relevant research.Through this method,the efficiency and accuracy of information retrieval in Tibetan search engines have been effectively improved.

关 键 词:XML 藏文网页 倒排索引 

分 类 号:TP274[自动化与计算机技术—检测技术与自动化装置]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象