检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:孙世昶[1,2] 林鸿飞[1] 孟佳娜 刘洪波[3]
机构地区:[1]大连理工大学计算机学院,辽宁大连116023 [2]大连民族大学计算机学院,辽宁大连116600 [3]大连海事大学信息科学技术学院,辽宁大连116026
出 处:《中文信息学报》2017年第1期66-74,共9页Journal of Chinese Information Processing
基 金:国家自然科学基金(61472058;61572102);辽宁省自然科学基金(201602195);中央高校自主基金(DC201502030202)
摘 要:迁移学习在一定程度上减轻了目标域的数据稀疏问题对泛化能力的影响,然而泛化能力的提高仍然受到负迁移等问题的影响。为了解决负迁移问题,该文提出使用源域结构的文本语料的信息粒化方法,用区间信息粒表示出源域数据集的结构对数据集中统计量的影响。然后提出区间二型模糊隐马尔可夫模型(Interval Type-2fuzzy Hidden Markov Model,IHMM)以处理区间信息粒。给出了IHMM的构建方法和去模糊化方法。在文本的词性标注任务中进行了多个实验,可以证实利用源域结构信息的粒迁移学习方法避免了负迁移,提高了模型的泛化能力。Transfer learning alleviates the data sparseness issue to some extent, but the generalization capacity is still hindered by negative-transfer problem. To address this issue, we propose an information granulation method for text corpora based on source domain structure. Interval granules are employed to express the influence of source domain structure on statistics of the dataset. We further design an Interval Type-2 fuzzy Hidden Markov Model (IHMM) to deal with the interval granules. Experiments on part-of-speech tagging proves that the proposed method avoids negative transfer and improves generalization capacity.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.129.253.49