一种基于词典的搜索引擎系统动态更新模型  被引量:13

A MODEL FOR DYNAMIC INFORMATION UPDATING IN LEXICON BASED SEARCH ENGINE

在线阅读下载全文

作  者:雷鸣[1] 刘建国[1] 王建勇[1] 陈葆珏[1] 

机构地区:[1]北京大学计算机科学技术系,北京100871

出  处:《计算机研究与发展》2000年第10期1265-1270,共6页Journal of Computer Research and Development

基  金:国家"九五"重点科技攻关项目基金资助!(项目编号 96 -743 -0 1-0 5 -0 1)

摘  要:基于词汇标注的特征项提取方法是中文信息处理的有效方法 ,但词汇的析取是基于词典的 ,词典的涵盖程度决定了词汇切分的准确率 .因而不断地学习新词汇、动态地维护词典 ,使整个中文信息处理系统具有自适应性和动态性就成了一个关键问题 .以搜索引擎系统为例 ,提出了一种基于词典动态变化的搜索引擎系统更新理论模型和实现模型 .相关实验表明 ,该模型对缩短搜索引擎信息库的更新时间。Lexicon based feature extraction is an effective method in Chinese information processing. But it highly depends on the lexicon used. The coverage of a lexicon determines the correctness of word segmentation. Therefore, it is crucial to learn new words continuously and to update lexicon dynamically, making the whole Chinese information processing system more adaptive and dynamic. Proposed in this paper are an innovative theoretical model and the implementation model for dynamic information updating in lexicon based search engine. The results of testing show that this model can reduce the time for re establishing the information database and can greatly improve the precision of a search engine.

关 键 词:万维网 词典 搜索引擎系统 中文信息处理 

分 类 号:TP391.12[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象