检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:高广尚 GAO Guangshang(Research Center for Modern Enterprise Management,Guilin University of Technology,Guilin,Guangxi 541004,China;School of Management,Guilin University of Technology,Guilin,Guangxi 541004,China)
机构地区:[1]桂林理工大学现代企业管理研究中心,广西桂林541004 [2]桂林理工大学商学院,广西桂林541004
出 处:《计算机工程与应用》2018年第7期11-19,65,共10页Computer Engineering and Applications
基 金:国家自然科学基金(No.71761008);广西高校人文社会科学重点研究基地基金(No.16YB010)
摘 要:旨在从无监督聚类角度分析实体解析过程的机制。从特定类型、经典算法角度研究了无监督聚类的思路;从经典算法改进、演化分析角度研究了无监督增量聚类的思路;最后,对无监督聚类研究下一步需要解决的问题进行了展望。无监督聚类技术不仅能很好地解决传统实体解析过程中存在的聚类效率和质量问题,而且还能利用已有的聚类结果对快速演化的数据进行增量解析,进而进一步满足大数据环境下亟需的增量解析需求。没有深入分析无监督聚类算法的评价指标,尽管面向实体解析的无监督聚类方法有诸多优势,但仍然面临着准确性和可扩展性等挑战。The aim is to analyze the mechanism of Entity Resolution(ER)from unsupervised clustering.This paper firstly elaborates the unsupervised clustering ideas from specific types,classical algorithms;then,it studies the unsupervised incremental clustering method from the classical algorithm improvements and evolution analyses.Finally,the problems to be solved in unsupervised clustering are prospected.Unsupervised clustering technology not only can solve the clustering efficiency and quality problems of traditional entity resolution,but also can use existing clustering results to implement incremental entity resolution for rapidly evolving data,to further meet the needs for incremental incremental entity resolution under the big data environment.There is no in-depth analysis of the evaluation index of unsupervised clustering algorithm.Although the unsupervised clustering method for entity analysis has many advantages,it still faces the challenges of accuracy and scalability.
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.191.194.2