如何在Python中解析簡單的內聯標記（即* bold *）？

Question

如何為修改文本的wiki文本子集實現解析器（在Python中），即：

*bold*, /italics/, _underline_

我正在將它轉換為LaTeX，因此轉換來自：

Hello, *world*! Let's /go/.

至：

Hello \textbf{world}! Let's \textit{go}.

雖然沒有具體說明它是轉換為LaTeX（特別是除了嵌套的情況，如“* bold / italics * whatami /”=>“textbf {bold \\ textit {italics} whatami}”）。

我查看了現有的標記庫，但它們（a）並不是我想要的維基語言，而且（b）看起來因為這個問題而被壓倒了。

我考慮過逆向工程Creoleparser ，但我想知道在我付出努力之前別人有什么建議。

謝謝！

Answer 1

如果您的語言很小，正則表達式可能是最不痛苦的解決方案：

>>> import re
>>> str = "Hello, *world*! Let's /go/."
>>> str = re.sub(r"\*([^\*]*)\*", r"\textbf{\1}", str)
>>> str = re.sub(r"/([^/]*)/",   r"\textit{\1}", str)
>>> str
"Hello, \textbf{world}! Let's \textit{go}."

如何在Python中解析簡單的內聯標記（即* bold *）？

問題描述

1 個解決方案

解決方案1
7 已采納 2009-02-06 17:50:33

如何在Python中解析簡單的內聯標記（即* bold *）？

問題描述

1 個解決方案

解決方案1 7 已采納 2009-02-06 17:50:33

解決方案1
7 已采納 2009-02-06 17:50:33