检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:梁晓诚[1] 岳晓光[1] 麦范金[1] 赵子强[2] 路英[3] 王挺[4,5]
机构地区:[1]桂林理工大学信息科学与工程学院,广西桂林541004 [2]太原科技大学机械电子工程学院,山西太原030024 [3]莫纳什大学管理学院 [4]利物浦大学计算机科学系 [5]西交利物浦大学计算机科学与软件工程系,江苏苏州215123
出 处:《昆明理工大学学报(理工版)》2010年第4期76-79,88,共5页Journal of Kunming University of Science and Technology(Natural Science Edition)
基 金:广西自然科学基金资助项目(桂科自0991254)
摘 要:针对传统的搜索引擎对于自然语言理解方面存在的问题,文章研究了一种新的基于自然语言处理技术和相似度计算的智能搜索引擎的模型.其核心技术是基于自然语言处理的中文分词技术、语义相似度和对立度等理论,将这些概念理论结合起来,从用户习惯的思考角度,结合DotLucene开源全文搜索引擎建立一个智能的搜索引擎.研究表明,该模型在对已经收录的文档有着86.1%的查准率.该智能搜索引擎较好的对查询语句的实现了理解,能够对用户的提问做出正确的回答.To deal with the problems of traditional search engine in understanding natural language,this article proposes a new intelligent search engine model which is based on the natural language processing and similarity calculation.Its core technology is Chinese word segmentation technique based on natural language processing,semantic similarity and contrary degree.Thinking from the users' view,the model combines DotLucene with those concepts.The precision of the intelligent search engine is about 86.1%.The intelligent search engine can understand the natural languages to query and offer the right answer to users.
关 键 词:自然语言处理 中文分词 相似度 DOTLUCENE 智能搜索引擎
分 类 号:TP39[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.74