结合潜在语义分析与点互信息的同义词抽取  被引量:2

Synonym Extraction with Method of Combination of Latent Semantic Analysis and Pointwise Mutual Information

在线阅读下载全文

作  者:马海昌[1] 张志昌[1] 赵学锋[1] 孙飞[1] MA Hai-chang, ZHANG Zhi-chang, ZHAO Xue-feng, SUN Fei

机构地区:[1]西北师范大学计算机科学与工程学院,甘肃兰州730070

出  处:《电脑知识与技术》2014年第1期128-132,共5页Computer Knowledge and Technology

基  金:国家自然科学基金项目(刚163039,61163036);西北师范大学青年教师科研能力提升计划项目(NWNU-LKQN-10-2)

摘  要:同义词在信息检索、自动文摘、情感分析、机器翻译等应用中都发挥着重要的作用。该文提出在大规模语料中结合潜在语义分析与上下文互信息进行同义词挖掘的方法,分析了不同的词汇上下文窗口选择、权值计算、潜在语义分析降维、余弦相似度计算在同义词抽取中的作用。实验结果表明,同义词抽取的效果明显提高。Synonym plays an important part in many natural language processing applications, such as information retrieval, auto-matic summarization, sentiment analysis and machine translation. This paper presents a synonym mining method by combination of Latent Semantic Analysis(LSA) and context mutual information from large-scale corpus, investigating the different window-based context selection, the computation of weight, the dimensionality reduction of LSA, the cosine similarity play a part in syn-onym extraction. Experimental results show that the effectiveness of synonym extraction has improved obviously.

关 键 词:同义词 同义词抽取 点互信息 潜在语义分析 余弦相似度 POINTWISE Mutual Information(PMI) LATENT Semantic Analysis(LSA) 

分 类 号:TP18[自动化与计算机技术—控制科学与工程;自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象