基于字符串匹配算法的搜索蒙古文的研究  

Study on the Searching Mongolian Based on String Matching Algorithms

在线阅读下载全文

作  者:菊花 

机构地区:[1]内蒙古师范大学传媒学院,呼和浩特

出  处:《计算机科学与应用》2013年第6期288-291,共4页Computer Science and Application

基  金:教育部人文社会科学研究项目“现行蒙古文编码相互转换研究”(编号:10XJC740004);内蒙古师范大学科技项目“基于语料的蒙古文单词分析软件的设计与实现(编号:KYZR1113)”。

摘  要:蒙古文是拼音文字,它的拼写规则是以词为单位竖写,词与词之间以空格分开,一个词的各个语音音素之间连写。常用的字符串匹配算法有蛮力字符串匹配算法、Boyer-Moore算法和Horspool算法。实现蒙古文搜索时,不仅需要借鉴己有的其它语言的信息搜索技术,同时也需要依据蒙古文的特点进行改进。因此本研究通过对常用的字符串匹配算法及蒙古文的语法特点进行分析,改进Horspool算法,通过六个步骤,完成了从蒙古文语料中搜索相关关键词的任务,并在语料中以选中状态显示所搜索到的关键词。>Mongolian is an alphabetic writing. Its spelling rules are: the words are written vertically word by word, with a space between every two words, and the speech phonemes of a word are written together. Programmer always uses three string matching algorithms: the brute force string matching algorithms, the Boyer-Moore algorithm and the Horspool algorithm. When searching Mongolian key words, we should not only refer to the information searching technology of other languages, but also make some improvement according to the properties of Mongolian. This paper analyzes the string matching algorithms and the properties of Mongolian and improves the Horspool algorithm to search the Mongolian key words using six steps, and shows the selected status of the Mongolian key words in the corpus.

关 键 词:蒙古文 算法 字符串 搜索 

分 类 号:TP39[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象