面向协调搜索的文本相似度计算方法  

Text Similarity Calculation Based on Search System

在线阅读下载全文

作  者:孙程程[1] 李爱平[1] 黄九鸣[1] SUN Cheng-cheng,LI Ai-ping,HUANG Jiu-ming(National University of Defense Technology,Changsha 410000,China)

机构地区:[1]国防科技大学计算机学院,湖南长沙410000

出  处:《电脑知识与技术》2014年第7期4460-4462,4485,共4页Computer Knowledge and Technology

基  金:国家重点基础研究发展计划(973计划)项目; 社交网络分析与网络信息传播的基础研究(项目编号:SQ2012CB03747); 科技支撑项目“面向互联网的海量情报信息分析挖掘关键技术及系统”

摘  要:近年来文本相似度计算在文本聚类、智能检索、网页问答、结果去重等其他许多自然语言处理领域具有举足轻重的地位,尤其是在搜索引擎中。该文简单论述了文本相似度计算的常用方法,以及本系统如何利用文本相似度计算判断多文本的同一性。更重要的是提出了迭代搜索的概念,进一步细化信息检索工作,尽可能确保信息检索的正确性,提高效率,解放人工。In recent years, text similarity calculation has played a decisive role in text clustering, Web intelligent information retrieval, question answering system, Webpage duplicate removal, Natural Language Processing and many other files, especially in the search engine. This article briefly discusses the commonly used methods of text similarity computing, as well as the system of how to use text similarity calculation to determine the same multiple text. More important thing is proposing the concept of the iterative search, which made further refining information retrieval, as far as possible to ensure correctness, information retrieval to improve the efficiency, the liberation of artificial.

关 键 词:空间向量 相似度 迭代搜索 

分 类 号:TP391[自动化与计算机技术—计算机应用技术;自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象