繁体   English   中英

Prolog DCG用于解析转义序列

[英]Prolog DCG for parsing escaped sequences

我需要将字符串^borrow$ ^\\$500$解析到列表[borrow, $500] 我到目前为止写的语法是

:- use_module(library(dcg/basics)).

write_list([]).
write_list([H|T]) :- atom_codes(S, H), write(S), nl, write_list(T).

% Grammar.
tags([Tag|Rest]) --> string(_), tag(Tag), tags(Rest).
tags([]) --> string(_).
tag(Tag) --> "^", tag_contents(Tag), "$".
tag_contents(Tag) --> string(Tag).

当我在令牌中没有\\$时,哪种方法有效:

?- phrase(tags(T), "^pisica$ ^catel$"), write_list(T).
pisica
catel
?- phrase(tags(T), "^borrow$ ^\\$500$"), write_list(T).
borrow
\

使用Prolog DCG解析此类转义序列的最佳实践是什么?

问题是tag_contents // 1只捕获反斜杠,然后$在父调用中使标记停止。

这是解决此问题的丑陋方法:

tag(Tag1) -->
   "^", tag_contents(Tag), [C], "$", {C \= 0'\\, append(Tag, [C], Tag1) }.

编辑

更好的一个:

tag(Tag) --> "^", tag_contents(Tag), "$", {\+last(Tag, 0'\\)}.

编辑

“最佳实践”当然是根据上下文规则来处理嵌套内容的。 您需要更严格的代码...

tag(Tag) --> "^", tag_contents(Tag).

tag_contents([0'\\,C|Cs]) --> "\\", [C], !, tag_contents(Cs).
tag_contents([]) --> "$".
tag_contents([C|Cs]) --> [C], tag_contents(Cs).

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM