检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]兰州大学信息科学与工程学院,甘肃兰州730000
出 处:《广西师范大学学报(自然科学版)》2011年第1期167-172,共6页Journal of Guangxi Normal University:Natural Science Edition
基 金:国家自然科学基金资助项目(61003139;60903102);兰州大学中央高校基本科研业务费专项资金(lzujbky-2010-90)
摘 要:本文主要研究基于公式的数学搜索引擎中数学公式的识别和提取方法,总结了MathML、Open-Math、LaTex、Infix格式数学公式在网页中出现时的各自特征,提出了基于特征和启发式规则的公式识别和提取方法,并用实验说明了该识别和提取方法的可行性和准确率。The paper introduces the recognizing and extracting methods of mathematics expressions in formula-based mathematics search engine.It summarizes the corresponding features of MathML,OpenMath,LaTex and Infix when they are embedded in a Web page.A feature-based heuristic method of recognizing and extracting mathematical expressions is given in the paper.The experiments proves that the method is effective and useful.
关 键 词:搜索引擎 爬虫 公式搜索 数学公式 MATHML OpenMath
分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.195