一种基于AC自动机的藏文多模式匹配算法  被引量:2

在线阅读下载全文

作  者:王蒙 彭展 

机构地区:[1]西藏民族大学,陕西省咸阳市712000

出  处:《电子技术与软件工程》2023年第1期143-148,共6页ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING

基  金:西藏自治区自然科学基金项目《藏文模式匹配与文本索引关键技术研究》(XZ202101ZR0089G)。

摘  要:本文基于AC(Aho-Corasick)算法提出了一种适用于藏文字符集的多模式匹配算法——TAC(Tibetan Aho-Corasick)算法。该算法有效利用藏文以音节点为结尾这一特点,检测到失配字符后不再将文本串读入自动机而是进行下一个词读入,从而提高了效率。实验结果表明,在处理藏文多模式匹配方面,TAC算法相较于AC算法效率大幅度提高。可很好地应用于藏文字取证、拼写检查器以及抄袭检测等领域。

关 键 词:藏文处理 AC算法 多模式匹配 文本匹配 算法改进 

分 类 号:H214[语言文字—少数民族语言] TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象