如何在JavaCC中实现JavaScript / ECMAScript“此处没有LineTerminator”规则？

Question

我将继续为ECMAScript 5.1编写JavaCC语法。 它实际上运行得很好，我想我现在已经涵盖了大多数表达式。

我现在有两个问题，它们都与自动分号插入有关（第7.9.1节）。 这就是其中之一。

该规范定义了以下产品：

PostfixExpression :
    LeftHandSideExpression
    LeftHandSideExpression [no LineTerminator here] ++
    LeftHandSideExpression [no LineTerminator here] --

如何实现可靠的“此处没有LineTerminator”检查？

为了记录，我的LINE_TERMINATOR目前类似：

SPECIAL_TOKEN :
{
    <LINE_TERMINATOR: <LF> | <CR> | <LS> | <PS> >
|   < #LF: "\n" > /* Line Feed */
|   < #CR: "\r" > /* Carriage Return */
|   < #LS: "\u2028" > /* Line separator */
|   < #PS: "\u2029" > /* Paragraph separator */
}

我已经阅读了有关词法状态的信息，但是我不确定这是否是正确的方向。 我检查了我发现的其他一些JavaScript语法，但没有在其中找到任何类似的规则。 （当我尝试从这些语法中超越某些东西时，我实际上感觉自己是一个全面的货神。）

我会为正确的搜索方向提供一个指针，一个提示或只是一个关键字。

Answer 1

我认为对于“限产”，您可以这样做

void PostfixExpression() : 
{} {
     LeftHandSideExpression() 
     (
         LOOKAHEAD( "++", {getToken(0).beginLine == getToken(1).beginLine})
         "++"
     |
         LOOKAHEAD( "--", {getToken(0).beginLine == getToken(1).beginLine})
         "--"
     |
         {}
     )
}

Answer 2

更新正如Gunther指出的，由于规范7.4中的这一段，我的原始解决方案是不正确的：

注释的行为类似于空格，并且被丢弃，除了注释之外，如果MultiLineComment包含行终止符，则出于语法语法分析的目的，整个注释都被视为LineTerminator。

我正在发布更正，但问题的末尾保留了原始解决方案。

更正的解决方案

Theodore Norvell提出的核心思想是使用语义超前。 但是我决定实施更安全的检查：

public static boolean precededByLineTerminator(Token token) {
    for (Token specialToken = token.specialToken; specialToken != null; specialToken = specialToken.specialToken) {
        if (specialToken.kind == EcmaScriptParserConstants.LINE_TERMINATOR) {
            return true;
        } else if (specialToken.kind == EcmaScriptParserConstants.MULTI_LINE_COMMENT) {
            final String image = specialToken.image;
            if (StringUtils.containsAny(image, (char)0x000A, (char)0x000D, (char)0x2028,
                    (char)0x2029)) {
                return true;
            }
        }
    }
    return false;
}

语法是：

expression = LeftHandSideExpression()
(
    LOOKAHEAD ( <INCR>, { !TokenUtils.precededByLineTerminator(getToken(1))} )
    <INCR>
    {
        return expression.postIncr();
    }
|   LOOKAHEAD ( <DECR>, { !TokenUtils.precededByLineTerminator(getToken(1))} )
    <DECR>
    {
        return expression.postDecr();
    }
) ?
{
    return expression;
}

因此，此处考虑++或--前提是它们前面没有行终止符。

原始解决方案

这不是我最终解决它的方式。

Theodore Norvell提出的核心思想是使用语义超前。 但是我决定实施更安全的检查：

public static boolean precededBySpecialTokenOfKind(Token token, int kind) {
    for (Token specialToken = token.specialToken; specialToken != null; specialToken = specialToken.specialToken) {
        if (specialToken.kind == kind) {
            return true;
        }
    }
    return false;
}

语法是：

expression = LeftHandSideExpression()
(
    LOOKAHEAD ( <INCR>, { !TokenUtils.precededBySpecialTokenOfKind(getToken(1), LINE_TERMINATOR)} )
    <INCR>
    {
        return expression.postIncr();
    }
|   LOOKAHEAD ( <DECR>, { !TokenUtils.precededBySpecialTokenOfKind(getToken(1), LINE_TERMINATOR)} )
    <DECR>
    {
        return expression.postDecr();
    }
) ?
{
    return expression;
}

因此，此处考虑++或--前提是它们前面没有行终止符。

如何在JavaCC中实现JavaScript / ECMAScript“此处没有LineTerminator”规则？

问题描述

2 个解决方案

解决方案1
3 已采纳 2014-11-06 22:28:22

解决方案2
1 2015-03-17 20:41:03

更正的解决方案

原始解决方案

如何在JavaCC中实现JavaScript / ECMAScript“此处没有LineTerminator”规则？

问题描述

2 个解决方案

解决方案1 3 已采纳 2014-11-06 22:28:22

解决方案2 1 2015-03-17 20:41:03

更正的解决方案

原始解决方案

解决方案1
3 已采纳 2014-11-06 22:28:22

解决方案2
1 2015-03-17 20:41:03