基于随机游走算法的中文文档信息处理模型  

在线阅读下载全文

作  者:县小平 马国俊 

机构地区:[1]甘肃民族师范学院计算机科学系

出  处:《青海科技》2019年第3期45-48,共4页Qinghai Science and Technology

基  金:甘肃民族师范学院2016年度校长科研基金项目《学习分析技术在网络学习行为和学习效果中的应用研究》(GSNUXM16-14)资助

摘  要:由于中文信息处理的复杂性和特殊性,中文搜索引擎技术需要不断改进,中文搜索引擎不能直接照搬国外技术,研究和分析中文的专业知识,可以准确地发现在海量信息库中对中文信息的需求。本文在字符识别中引入了随机游走模型的字典学习和稀疏表示,解决了钢笔字符和传真字符的噪声问题,提出了一种新的分析框架用来帮助处理。该识别方法不需要预处理操作如字符二值化和细化,仅需要一个特征和一个分类器,与当前的多特征多级联分类器融合识别。提出的方法具有低复杂度的特点,实验结果也反映了该模型的鲁棒性。

关 键 词:中文文档 信息处理模型 随机游走 数据挖掘 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象