检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:曹金超 黄滔 陈刚[1,3] 吴晓凡 陈珂 CAO Jinchao;HUANG Tao;CHEN Gang;WU Xiaofan;CHEN Ke(College of Computer Science and Technology,Zhejiang University,Hangzhou 310027,China;Zhejiang Bangsun Technology Co.,Ltd.,Hangzhou 310012,China;Key Laboratory of Big Data Intelligent Computing of Zhejiang Province,Zhejiang University,Hangzhou 310027,China;Netease(Hangzhou)Network Co.,Ltd.,Hangzhou 310051,China)
机构地区:[1]浙江大学计算机科学与技术学院,杭州310027 [2]浙江邦盛科技有限公司,杭州310012 [3]浙江大学浙江省大数据智能计算重点实验室,杭州310027 [4]网易(杭州)网络有限公司,杭州310051
出 处:《计算机科学与探索》2020年第7期1133-1141,共9页Journal of Frontiers of Computer Science and Technology
基 金:国家重点研发计划No.2017YFB1201001;国家自然科学基金No.61672455;浙江省自然科学基金No.LY18F020005。
摘 要:自然语言生成SQL查询不仅是构建智能数据库查询系统的一个重要组成部分,亦是新型供电轨道交通系统混合时态大数据个性化运维的难点之一。目前利用深度学习模型的方法专注于数据库中单表SQL查询生成,无法解决数据库中多表SQL查询生成。针对这个问题,采用一种基于SQL语句模板填充的方法,将序列生成问题转化为多个分类问题,在训练深度学习模型的过程中充分利用SQL子句不同预测成分之间的依赖关系。在FROM子句的多表JOIN路径生成方面,将其建模为斯坦纳树问题,采用一种全局最优的算法来进行求解。在一个开放的文本生成SQL数据集Spider上对模型和算法进行实验验证,实验结果表明该方法能有效地提升多表SQL查询生成的查询匹配准确率。SQL(structured query language)query generation from natural language is not only one of the most important parts of constructing intelligent database query system,but also one of the difficulties in the individualized operation and maintenance of hybrid temporal big data in the new power supply rail transit system.At present,the deep learning models almost focus on SQL query generation in a single table,but cannot solve multi-table SQL query generation in database.In order to solve this problem,this paper adopts a method named SQL sketch filling to transform the sequence generation problem into multiple classification problems.In the process of training the deep learning models,this paper makes full use of the dependencies of components in SQL clauses.In the generation of multi-table JOIN path of FROM clause,it is modeled as Steiner Tree problem and solved by a globally optimal algorithm.This method is validated on an open text-to-SQL dataset named Spider.The experimental results show that the model can improve the query-match accuracy of multi-table SQL query generation.
关 键 词:自然语言 SQL查询生成 多表 模板填充 深度学习
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.148.237.97