检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:雷鸣[1] 刘建国[1] 王建勇[1] 陈葆珏[1]
出 处:《计算机研究与发展》2000年第10期1265-1270,共6页Journal of Computer Research and Development
基 金:国家"九五"重点科技攻关项目基金资助!(项目编号 96 -743 -0 1-0 5 -0 1)
摘 要:基于词汇标注的特征项提取方法是中文信息处理的有效方法 ,但词汇的析取是基于词典的 ,词典的涵盖程度决定了词汇切分的准确率 .因而不断地学习新词汇、动态地维护词典 ,使整个中文信息处理系统具有自适应性和动态性就成了一个关键问题 .以搜索引擎系统为例 ,提出了一种基于词典动态变化的搜索引擎系统更新理论模型和实现模型 .相关实验表明 ,该模型对缩短搜索引擎信息库的更新时间。Lexicon based feature extraction is an effective method in Chinese information processing. But it highly depends on the lexicon used. The coverage of a lexicon determines the correctness of word segmentation. Therefore, it is crucial to learn new words continuously and to update lexicon dynamically, making the whole Chinese information processing system more adaptive and dynamic. Proposed in this paper are an innovative theoretical model and the implementation model for dynamic information updating in lexicon based search engine. The results of testing show that this model can reduce the time for re establishing the information database and can greatly improve the precision of a search engine.
分 类 号:TP391.12[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.40