检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]湛江海洋大学信息工程学院,湛江524088 [2]哈尔滨工业大学计算机科学与技术学院,哈尔滨150001
出 处:《计算机工程与应用》2003年第11期69-70,152,共3页Computer Engineering and Applications
基 金:国家863项目"语音识别与语音合成的短语构成技术"资助(编号:863-306-03-02-1)
摘 要:为了压缩基于词的统计语言模型的参数空间,以便构造模型空间更加紧密的ClassN-gram模型,该文研究了汉语词的自动聚类技术,提出了一种基于评价函数的汉语词的聚类算法,该算法采用词的相似度理论,并通过构造词的启发式候选词类链表,极大提高了聚类算法的工作效率。For the sake of compressing parameter space of word-based statistical language model,the word clustering technique is discussed so that compact Class N-gram can be built.The Chinese words clustering algorithm based on evaluation function is put forward,which employs a kind of vector space method to compute word similarity.The efficiency of this algorithm is evidently improved by building a heuristic list that consists of candidate word classes for each word,consequently the Chinese Class N-gram is built.
分 类 号:TP391.2[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.13