[英]Prolog DCG for parsing escaped sequences
我需要将字符串^borrow$ ^\\$500$
解析到列表[borrow, $500]
。 我到目前为止写的语法是
:- use_module(library(dcg/basics)).
write_list([]).
write_list([H|T]) :- atom_codes(S, H), write(S), nl, write_list(T).
% Grammar.
tags([Tag|Rest]) --> string(_), tag(Tag), tags(Rest).
tags([]) --> string(_).
tag(Tag) --> "^", tag_contents(Tag), "$".
tag_contents(Tag) --> string(Tag).
当我在令牌中没有\\$
时,哪种方法有效:
?- phrase(tags(T), "^pisica$ ^catel$"), write_list(T).
pisica
catel
?- phrase(tags(T), "^borrow$ ^\\$500$"), write_list(T).
borrow
\
使用Prolog DCG解析此类转义序列的最佳实践是什么?
问题是tag_contents // 1只捕获反斜杠,然后$在父调用中使标记停止。
这是解决此问题的丑陋方法:
tag(Tag1) -->
"^", tag_contents(Tag), [C], "$", {C \= 0'\\, append(Tag, [C], Tag1) }.
编辑
更好的一个:
tag(Tag) --> "^", tag_contents(Tag), "$", {\+last(Tag, 0'\\)}.
编辑
“最佳实践”当然是根据上下文规则来处理嵌套内容的。 您需要更严格的代码...
tag(Tag) --> "^", tag_contents(Tag).
tag_contents([0'\\,C|Cs]) --> "\\", [C], !, tag_contents(Cs).
tag_contents([]) --> "$".
tag_contents([C|Cs]) --> [C], tag_contents(Cs).
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.