检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]吉林农业大学信息技术学院,吉林长春130118 [2]长春工业大学计算机科学与工程学院,吉林长春130012
出 处:《计算机应用与软件》2012年第1期155-158,216,共5页Computer Applications and Software
基 金:吉林省科技发展计划项目青年基金(20100155);吉林省科研发展计划科技支撑重点项目(20100214)
摘 要:给出基于LSC模型的EM方法进行汉语语义优选的学习。具体步骤是首先随机为参数模型赋予初值;然后迭代运行EM算法,直到收敛;最后计算动词和名词的语义关联度,以此衡量其搭配的可能性。大量实验结果表明LSC模型能够较好地体现动、名词的搭配模式,且算法迭代收敛速度快。该方法无需语法标注的语料库,适合应用于汉语。An Expectation-Maximisation(EM) algorithm based on latent semantic clustering(LSC) model is introduced for learning Chinese semantic selectional preferences.The specific procedure is as follows: First,the model parameters are designated their initial values randomly;secondly,EM algorithm is executed iteratively until convergence achieved;finally,the semantic association between verbs and nouns is calculated to measure their collocation possibility.Lots of experiment results show that LSC model is able to provide proper collocation patterns of verbs and nouns and the iterative convergence speed of the algorithm is fast as well.The method is suitable for Chinese as it does not need syntax-annotated corpora.
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.141.46.208