Spark SQL解析过程以及Antlr4入门
liuian 2024-12-05 14:27 45 浏览
Spark SQL解析过程
在Spark 2.0之后,Spark SQL使用Antlr 4来解析SQL表达式,其解析描述文件路径为spark源码根路径\sql\catalyst\src\main\antlr4\org\apache\spark\sql\catalyst\parser\SqlBase.g4, 比如下面的sql语句是如何转化成RDD的。
select name from person where age > 18
SQL执行流程:
不管解析被划分为几步,在Spark 执行环境中,都要转化成RDD的调用代码,才能被spark core所执行
那么这里面有个关键的点,就是查询的SQL , 怎么转化成未解析的逻辑计划;未解析的逻辑计划这个阶段接收的是抽象的语法树,所以我们需要知道的就是,这个SQL语句是就是通过Antlr4转成抽象语法树的;
Antlr4入门
1、下载Antlr4
链接地址:https://www.antlr.org/download/index.html
2、把下载的包放在安装目录
3、编写bat脚本,内容如下antlr4.bat
java -cp antlr-4.5.3-complete.jar org.antlr.v4.Tool %*
4、把安装目录添加到环境变量
5、构建maven项目,添加如下依赖
<dependency>
<groupId>org.antlr</groupId>
<artifactId>antlr4-runtime</artifactId>
<version>4.5.3</version>
</dependency>6、编写antlr文件,以g4结尾
grammar LearnAntlr ; // grammer是规则文件的头,要和文件名一样
@header{ //header代表生成的代码放在哪个包里面
package com.antlr4;
}
r : 'hello' ID; //r代表的是语法树的根结点
ID : [a-z]+ ;
WS : [ \t\r\n]+ -> skip ; //ID代表未知的值7、命令行进入antlr\src\main\java\com\antlr4>目录中,执行antlr4 LearnAntlr.g4,生成代码如下:
8、新建ListenerRewrite继承LearnAntlrBaseListener
public class ListenerRewrite extends LearnAntlrBaseListener {
@Override
public void exitR(LearnAntlrParser.RContext ctx) {
final String a = ctx.getChild(0).getText().toLowerCase();
final String b = ctx.getChild(1).getText().toLowerCase();
System.out.println(a + " " + b);
}
}9、词法和语法解析
public class TestAntlr4 {
public static void main(String[] args) {
//todo 输入 hello world
ANTLRInputStream inputStream = new ANTLRInputStream(" hello world");
//todo 新建词法分析器
LearnAntlrLexer lexer = new LearnAntlrLexer(inputStream);
//todo 新建一个词法符号的缓冲区,用于存储词法分析器生成的词法符号
CommonTokenStream tokenStream = new CommonTokenStream(lexer);
//todo 新建一个语法分析器,处理词法符号缓冲区内容
LearnAntlrParser parser = new LearnAntlrParser(tokenStream);
//todo 针对规则,开始语法分析
LearnAntlrParser.RContext context = parser.r();
//todo 构建监听器
ListenerRewrite listener = new ListenerRewrite();
//todo 使用监听器初始化对语法分析树的遍历
ParseTreeWalker.DEFAULT.walk(listener,context);
}
}10、运行代码,输出hello world
- 上一篇:一文读懂jar包的小秘密
- 下一篇:Antrl4入门、安装、案例
相关推荐
- 繁体字输入法下载(繁体字输入法下载安装)
-
你下载百度手机输入法,默认的就是双拼,可以自己选择26键拼音输入01打开苹果手机,找到苹果商城,02打开下载中心,搜索“搜狗输入法”,03下载搜狗输入法,04等下载完成后桌面上会显示搜狗输入法,05然...
- 国产操作系统概念股(国产操作系统概念股票)
-
那么怎么构建该系统呢?一般情况下都是从以下几个方面: 第一、选股方法。虽然靠着均线能选股,靠着指标也能选股,但是系统性的选股方法则是要结合宏观经济整体运行位置和环境,行业发展现状和前...
- 电脑主机开机没反应(电脑主机开机没反应电源灯亮)
-
操作方法01第一种情况是电脑完全没有反应,那么就可能是电源没有连接上,检查插线板和机箱插头,重新插好就好了。?02还有是电脑机箱已经开启,但是显示屏还是黑的,那么这种情况就有可能是显示屏的电源没有连接...
- cad激活码2010(cad激活码和序列号)
-
1.首先激活码出现问题,需要进行激活确认。首先需要的中进入电脑C盘。2.可以先点击组织设置隐藏文件夹显示。3.勾选显示隐藏文件夹。4.找到C:\ProgramData文件夹,打开找到CAD文件夹。5....
- 联想windows7笔记本怎么连接网络
-
检查笔记本的无线网卡驱动1.右键我的电脑,点击“属性”,选择左侧“设备管理器”2.点击“网络适配器”,如果方框内没有驱动,请下载驱动精灵万能网卡版安装网卡驱动 二、若发现驱动前面是感叹号的&...
- 淘宝电脑版网页入口(淘宝网电脑版网页官方)
-
网站地址:https://www.taobao.com/网站链接:进入网站服务器IP:116.253.191.241网站描述:淘宝网首页,淘宝网-亚洲最大、最安全的网上交易平台,提供各类服饰、美容...
- 大学生用哪个牌子的笔记本电脑好
-
荣耀MagicBook14英寸轻薄窄边框笔记本电脑(AMD锐龙58G512GFHDIPS正版Office)冰河银这款的性价比较高。也可以根据自己的预算选同系列其他型号。...
- 免费手机模拟器(免费手机模拟器下载)
-
目前能成功在电脑上模拟苹果系统的iOS模拟器,对比市面上常见的安卓模拟器少太多了,主要原因还是iOS系统比较封闭,难于开发。虽然前面说开发很困难,但是国内还是有一些厉害的IT小组成功推出了iOS模拟器...
- 新手怎么制作word表格(工作表格制作)
-
步骤如下:1、本次演示使用的软件为word文字处理软件,软件版本为Microsoftoffice家庭和学生版2016。2、首先打开Excel电子表格,根据问题描述,我们在word中插入两页表格。3、...
-
- 电脑开机启动进不了系统怎么办
-
一、修复错误如果频繁无法正常进入系统,则开机后马上按F8,看能否进入安全模式或最后一次配置正确模式,如能则进入后会自动修复注册表,并回忆前几次出现不正常现象时进行了什么操作,并根据怀疑是某个应用软件导致问题产生,将其卸载,然后正常退出,...
-
2026-01-02 13:05 liuian
- win11任务栏隐藏不了(win11任务栏怎么隐藏)
-
方法/步骤: 1、打开电脑桌面,双击我的计算机。 2、打开控制面板。 3、点击类别切换到大图标或小图标。 4、找到通知区域图标打开。 5、选择显示图标或隐藏图标也可以仅显示通知,选好以后点击...
- 一周热门
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
