检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:徐以聪 田学东 李新福 杨芳 史青宣 Xu Yicong;Tian Xuedong;Li Xinfu;Yang Fang;Shi Qingxuan(School of Cyber Security and Computer,Hebei University,Baoding 071002,China)
机构地区:[1]河北大学网络空间安全与计算机学院,保定071002
出 处:《数据分析与知识发现》2020年第7期118-126,共9页Data Analysis and Knowledge Discovery
基 金:国家自然科学基金项目“数学表达式资源获取与检索模型研究”(项目编号:61375075);河北省自然科学基金项目“引入犹豫模糊逻辑的数学检索结果文档排序”(项目编号:F2019201329);河北省教育厅河北省高等学校科学技术研究重点项目“基于犹豫模糊集的古籍汉字图像检索”(项目编号:ZD2017208)的研究成果之一。
摘 要:【目的】从大量数学表达式中检索出与查询表达式相似的表达式,并对检索结果排序。【方法】提取单个数学表达式的特征子式,利用犹豫模糊集理论计算每个特征子式的权重值;将属于同一表达式的子式权重值进行累加,计算表达式间的相似度得分,按照分数从高到低的顺序排列检索结果。【结果】从时间和相似度的角度进行分析,本文方法检索效率较高,检索结果较准确,本文排序方法的NDCG值最高为0.88,表明该排序方法较合理。【局限】本文排序方法并非完全面向数学表达式语义检索。【结论】引入犹豫模糊集计算子式权重能够更准确地检索出具有相同结构特征的数学表达式。[Objective] This paper proposes a retrieval method for mathematical expressions, aiming to find items matching the queries from a large collection of math expressions. [Methods] Firstly, we extracted characteristic subformulas of each single mathematical expression and introduced the theory of hesitant fuzzy sets(HFSs) to compute their weights. Secondly, we added the weight values of all subformulas belonging to the same expression as the similarity scores between the index and query. Finally, we ranked retrieved results with the similarity scores. [Results] The proposed method had higher retrieval efficiency and better results than traditional methods,with the highest NDCG value reached 0. 88. [Limitations] Our method did not fully address the semantics of mathematical expressions. [Conclusions] The proposed method could retrieve the needed mathematical expressions more accurately.
关 键 词:数学表达式检索 犹豫模糊集理论 子式权重 相似度得分
分 类 号:TP393[自动化与计算机技术—计算机应用技术] G250[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15