数据库读写策略在文本挖掘中的优化研究  被引量:1

Optimization Study on Strategy for Reading and Writing Database in Text Mining

在线阅读下载全文

作  者:张志强[1] 王伟钧[1] 周利军[1] 黎忠文[1] 

机构地区:[1]成都大学计算机学院,四川成都610106

出  处:《成都大学学报(自然科学版)》2015年第3期262-265,274,共5页Journal of Chengdu University(Natural Science Edition)

基  金:四川省教育厅自然科学基金(15ZB0390);四川省科技厅应用基础研究(2014JY0054);四川省科技支撑计划(2014SZ0107;2015GZ0333)资助项目

摘  要:在文本挖掘过程中,对数据库中存储的分词数据进行读写操作是一个非常重要的过程.当存储在数据库中的数据量是海量时,对数据库的读写操作就非常频繁,如果采用常规的数据库读写策略进行数据处理,则效率会很低,从而影响整个文本挖掘项目的实施进度.为了提高数据处理的效率,以文本挖掘中新词候选词的产生过程为应用背景,对常规的数据库读写策略进行优化研究,设计并实现了优化后的数据库读写策略.实验表明,采用优化后的数据库读写策略的数据处理效率比常规的数据库读写策略的数据处理效率高.In text mining, it is a very important process to read and write the word segmentation data stored in the database. When the amount of data stored in the database is massive,the reading and writing database becomes very frequent. Hence, if the conventional strategy for reading and writing database is adopted, the efficiency of mass data processing will be very low, which will affect the implementation progress of the entire text mining project. In order to improve the efficiency of data processing,based on the appearance of the candidate words among the new words in text mining, this paper does research on the optimization of the conventional strategy for reading and writing database, and then designs and implements the optimized strategies for reading and writing database. The experiments show that the efficiency of the optimized strategies for reading and writing database is higher than the conventional strategy.

关 键 词:文本挖掘 海量数据 数据库读写策略 优化研究 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象