AST 抽象语法树及其妙用
大家好,我是山月。
AST
是 Abstract Syntax Tree
的简称,是前端工程化绕不过的一个名词。它涉及到工程化诸多环节的应用,比如:
如何将 Typescript 转化为 Javascript (typescript)
如何将 SASS/LESS 转化为 CSS (sass/less)
如何将 ES6+ 转化为 ES5 (babel)
如何将 Javascript 代码进行格式化 (eslint/prettier)
如何识别 React 项目中的JSX (babel)
GraphQL、MDX、Vue SFC 等等
而在语言转换的过程中,实质上就是对其 AST 的操作,核心步骤就是 AST 三步走
Code -> AST (Parse)
AST -> AST (Transform)
AST -> Code (Generate)
// Code const a = 4 // AST { "type": "Program", "start": 0, "end": 11, "body": [ { "type": "VariableDeclaration", "start": 0, "end": 11, "declarations": [ { "type": "VariableDeclarator", "start": 6, "end": 11, "id": { "type": "Identifier", "start": 6, "end": 7, "name": "a" }, "init": { "type": "Literal", "start": 10, "end": 11, "value": 4, "raw": "4" } } ], "kind": "const" } ], "sourceType": "module" } 复制代码
不同的语言拥有不同的解析器,比如 Javascript 的解析器和 CSS 的解析器就完全不同。
对相同的语言,也存在诸多的解析器,也就会生成多种 AST,如 babel
与 espree
。
在 AST Explorer 中,列举了诸多语言的解析器(Parser),及转化器(Transformer)。
AST 的生成
AST 的生成这一步骤被称为解析(Parser),而该步骤也有两个阶段: 词法分析(Lexical Analysis)和语法分析(Syntactic Analysis)
词法分析
词法分析用以将代码转化为 Token
流,维护一个关于 Token 的数组
// Code a = 3 // Token [ { type: { ... }, value: "a", start: 0, end: 1, loc: { ... } }, { type: { ... }, value: "=", start: 2, end: 3, loc: { ... } }, { type: { ... }, value: "3", start: 4, end: 5, loc: { ... } }, ... ] 复制代码
词法分析后的 Token 流也有诸多应用,如:
代码检查,如 eslint 判断是否以分号结尾,判断是否含有分号的 token
语法高亮,如 highlight/prism 使之代码高亮
模板语法,如 ejs 等模板也离不开
语法分析
语法分析将 Token 流转化为结构化的 AST,方便操作
{ "type": "Program", "start": 0, "end": 5, "body": [ { "type": "ExpressionStatement", "start": 0, "end": 5, "expression": { "type": "AssignmentExpression", "start": 0, "end": 5, "operator": "=", "left": { "type": "Identifier", "start": 0, "end": 1, "name": "a" }, "right": { "type": "Literal", "start": 4, "end": 5, "value": 3, "raw": "3" } } } ], "sourceType": "module" }
作者:shanyue
链接:https://juejin.cn/post/7034821195484626980