Lex：我如何防止它與子串相匹配？

Question

例如，我應該將“int”轉換為“INT”。 但如果有“整數”這個詞，我認為它不應該變成“INTeger”。

如果我定義"int" printf("INT"); 但是，子串匹配。 有沒有辦法防止這種情況發生？

Answer 1

我相信以下內容可以捕獲您想要的內容。

%{
#include <stdio.h>
%}

ws                      [\t\n ]

%%

{ws}int{ws}         { printf ("%cINT%c", *yytext, yytext[4]); }
.                       { printf ("%c", *yytext); }

要擴展超出單詞邊界（在本例中為{ws} ），您需要向ws添加修飾符或添加更多特定的檢查。

Answer 2

好吧，這是我怎么做的：

(("int"([a-z]|[A-Z]|[0-9])+)|(([a-z]|[A-Z]|[0-9])+"int")) ECHO;
"int" printf("INT");

更好的建議歡迎。

Answer 3

Lex將選擇與當前輸入匹配最長的規則。 要避免子字符串匹配，您需要包含一個比int更長的附加規則。 最簡單的方法是添加一個簡單的規則來獲取長於一個字符的任何字符串，即[a-zA-Z]+ 。 整個lex程序看起來像這樣： -

%%

[\t ]+          /* skip whitespace */
int { printf("INT"); }
[a-zA-Z]+       /* catch-all to avoid substring matches */

%%

int main(int argc, char *argv[])
   {
   yylex();
   }

Lex：我如何防止它與子串相匹配？

問題描述

3 個解決方案

解決方案1
2 已采納 2010-03-02 01:30:53

解決方案2
1 2010-03-01 21:46:42

解決方案3
1 2010-03-02 01:18:37

Lex：我如何防止它與子串相匹配？

問題描述

3 個解決方案

解決方案1 2 已采納 2010-03-02 01:30:53

解決方案2 1 2010-03-01 21:46:42

解決方案3 1 2010-03-02 01:18:37

解決方案1
2 已采納 2010-03-02 01:30:53

解決方案2
1 2010-03-01 21:46:42

解決方案3
1 2010-03-02 01:18:37