R语言中文分词方法在审计短文本中的应用  被引量:2

在线阅读下载全文

作  者:牛艳芳[1] 孙瑜[1] 韩新 

机构地区:[1]山东财经大学 [2]山东省莱芜市审计局

出  处:《中国审计》2017年第11期41-42,共2页China Audit

基  金:本文系国家社科科学基金(16BJY021)、山东省自然科学基金(ZP2014GM015)和教育部人文社会科学研究青年基金(14YJCZH111)阶段}生研究成果.

摘  要:面对复杂的信息化环境,审计人员需要分析的非结构化文本数据日益增多,如被审计单位的规章制度、会议纪要、办公文档关键字词的检索,财务核算中的摘要分析、财政支付系统中的项目名称、被审计单位的地址等。当前,非结构化数据所占的比重不断增大,因其不具备固定的数据结构特点,使得传统查询性分析的审计方法力不从心。本文探素了当前流行的中文分词方法在财政支出审计短文本中的应用。

关 键 词:文本数据 中文分词 审计人员 应用 财政支出审计 被审计单位 语言 非结构化 

分 类 号:F239.45[经济管理—会计学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象