互联网金融新闻搜索的文本消重方法研究  

Duplicated Text Removal for Financial News over Internet

在线阅读下载全文

作  者:阮进[1] 袁景瑞[1] 梁循[1] 

机构地区:[1]北京大学计算机研究所,北京100871

出  处:《西华大学学报(自然科学版)》2008年第2期1-3,共3页Journal of Xihua University:Natural Science Edition

基  金:国家自然科学基金项目(No.70571003)

摘  要:在互联网新闻搜索引擎的研究中,去除内容相同或者相近的新闻是提高搜索引擎效率和准确度的关键技术之一。对于金融等领域的专业新闻来说,采用传统方法的消重效果不尽如人意,不适合金融专业人士对于新闻高效准确处理的需求。本文在基于金融新闻文档关键词提取技术的基础上,结合金融领域词典技术,提出了适合于专业新闻的金融新闻文本消重技术,并分析了其效率。本文的结果对于金融专业人员进行深入地金融新闻处理具有重要意义。Removal of duplicated news is an important technique for Internet search engine, which improves the efficiency and accuracy of the search engine. Using the traditional method to wipe off the duplicated financial information over Internet cannot meet the requirements, which is not suitable for financial professionals to process information more effectively and accurately. This paper introduces a technology, which is based on financial keyword extraction combined with financial dictionary technology, to remove the duplicated text of financial information and analyzes its effectiveness. The result obtained benefits the financial professionals for information processing and is of great significance in in-depth processing of financial news.

关 键 词:互联网 金融新闻 文本消重 相似度 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象