基于分布式计算框架Spark的语义相关度计算方法  被引量:1

在线阅读下载全文

作  者:殷晓春[1] 

机构地区:[1]南京信息职业技术学院人工智能学院,江苏南京210023

出  处:《电脑知识与技术》2023年第33期72-75,共4页Computer Knowledge and Technology

摘  要:该文利用了分布式方法构建分布式语义相关度计算框架,提出了分布式语义分析的新方法,构建巨大的语义空间。该方法通过构建一系列的概念向量以及与其相关的维基百科中的词构成概念向量的维数,从而构建概念-词语矩阵。然后,通过提取概念-词语矩阵的两个词语向量,根据它们的余弦测度计算两个词语的语义相关度。该方法建立在开源分布式计算框架Spark上。对比已有的显式语义分析(Explicit Semantic Analysis Method)方法,该文提出的方法在构建概念-词语向量空间时,明显地减少了计算时间。同时,实验结果表明,数据量足够大时,本方法的Spearman相关系数达到0.797。

关 键 词:分布式计算 语义相关度 维基百科 权重 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象