检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:何杰 卢菁[1] 邵清[1] 刘丛[1] He Jie;Lu Jing;Shao Qing;Liu Cong(School of Optical-electrical&Computer Engineering,University of Shanghai for Science&Technology,Shanghai 200093,China)
机构地区:[1]上海理工大学光电信息与计算机工程学院,上海200093
出 处:《计算机应用研究》2020年第6期1729-1734,共6页Application Research of Computers
基 金:国家自然科学基金青年基金资助项目(61703278)。
摘 要:目前已提出的真值发现方法无法解决对象由多个单值属性与多值属性共同组成的情况,若将这些属性拆分后分别处理则会破坏属性间原有的关联,导致计算结果不准确。为此提出一种多属性数据的联合真值发现方法 ATD4MA,将对象各观察值通过遗传算法中的染色体进行建模,针对问题特性对群体初始化算法和染色体基本动作进行改进,控制染色体的演化行为对各属性进行约束,以各对象的真值染色体与各数据源提供的观察值染色体间的差异加权和达到最小为目标建立优化模型,解决了对象包含多个属性的真值发现问题。在两个真实数据集上的实验证明了提出方法的正确性和有效性。The current truth discovery method cannot solve the case where the object is composed of many single-valued attributes and multi-valued attributes. Separate processing of these attributes will destroy the original association between attributes,resulting in inaccurate results. This paper proposed an ATD4 MA algorithm. It modeled the observation values of the object using the chromosomes in the genetic algorithm. Then it improved the population initialization algorithm and the basic action of the chromosome according to the problem characteristics. By controlling the evolution behavior of chromosomes,it established the optimization model to minimize the weighted sum of difference between the truth-value chromosomes of each object and the observed values provided by each data source. Therefore it solved the problem of truth discovery where the object contained multiple attributes. Experiments on two real data sets show the correctness and effectiveness of the proposed method.
关 键 词:真值发现 数据相关性 单值属性 多值属性 遗传优化算法
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:52.15.165.239