基于数据挖掘的面向话题搜索引擎研究  被引量:4

Research on Topic Oriented Search Engine Based on Data Mining Technology

在线阅读下载全文

作  者:陈勇[1] 张佳骥[1] 吴立德[2] 刘海娟[1] 

机构地区:[1]中国电子科技集团公司第五十四研究所,河北石家庄050081 [2]复旦大学,上海200433

出  处:《无线电通信技术》2011年第5期38-40,共3页Radio Communications Technology

摘  要:为了解决面向话题的搜索问题,提出一种新的面向话题的检索技术。首先分析了面向话题的搜索技术所面临的问题,然后基于数据挖掘技术提出了解决方案。利用数据挖掘技术抽取文本的多层次语义特征,形成对文本的多精度表示,抽取的特征不仅包括单个词特征也包括多词特征。建立了一个示例检索系统,实验表明利用多层次文本特征能够很好地实现面向话题的文本检索。A novel topic-oriented text retrieval approach is proposed in this paper. In this approach,data mining techniques are used to extract multi-level semantic features from texts, generating multi-precision representation on text. Features extracted from text include both single word features and multi-word features. With this approach, more significant feature in text can be discovered and used. Extracted features are closed to the essence of texts. Experiments show that multi-level features can be used to create a topic-oriented text retrieval system.

关 键 词:信息检索 数据挖掘 文本分析 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象