[英]Type checking of infix operators in compiler
我正在编写一个编译器(在Haskell中),在该语言的语法中,有一些规则可以添加中缀运算符(以加法为例):
EAdd . Expr ::= Expr "+" Expr
这意味着EAdd
是一个表达式,它由表达式,字符串"+"
和另一个表达式组成。
解析器返回抽象语法树(AST):
data Expr = ... | EAdd Expr Expr
如果要检查是否为函数的调用指定了正确类型的参数,我想做一个类型检查器。
注意,“ +”是一个接受两个整数并返回一个整数的函数。 其他运算符类似。
目前,我想出了三种方法来对EAdd
,所有方法都包括将“ +”作为函数添加到初始符号表中:
声明infix plus是用于调用带有两个参数的函数“ +”的语法糖。 在解析器和EAdd
之间放置“ desugarizer”,它将AST从解析器转换为另一种数据类型(没有EAdd
)。
(与第一个类似)声明infix plus是语法糖,但是desugarizer使用相同的AST数据类型。 当EAdd
被赋予EAdd
时,返回一个错误。
将“脱糖器”内联到typechecker中。 与此类似:
... typecheck (EAdd ab) = typecheck (ECall infixPlus [a, b]) ...
请注意,所有二进制中缀运算符均受此约束(其他算术,布尔运算,比较运算符)。
似乎第一种方法是正确的。 但这意味着以后在编译器管道中,尤其是在代码生成器中 ,应将这些ECalls
作为特殊情况处理,因为在编译器输出(在我的情况下为llvm)中,这些函数应该被内联(与通常的函数调用不同) 。 这意味着codegen具有一系列函数,这些函数的调用与其他函数调用的处理方式不同。
解决此问题的最佳方法是什么?
UPD
Haskell中类似问题的处理方式(来自https://ghc.haskell.org/trac/ghc/wiki/Commentary/Compiler/Renamer ):
...重命名器执行以下操作:
- 整理固定装置。 解析器将所有中缀应用程序解析为左关联,而不管其固定性如何。 例如,“ a + b * c”被解析为“(a + b)* c”。 重命名器使用模块中声明的固定性来重新关联此类嵌套的运算符应用程序。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.