[英]Converting HTML to another syntax (LaTeX) with PHP
我正在嘗試做一個自定義HTML到LaTeX轉換器,它使用Wordpress帖子作為源。
基本上,它需要做一些“替換”,例如:
<h2>H2 Title</h2>
<p>Text text text</p>
<img src="/image.png" alt="Image ALT tag" \>
對此
\begin{document}
\section{H2 Title}
Text text text
\shorthandoff{=}
\begin{figure}[H]
\centering
\includegraphics[scale=0.7]{./img/image.png}
\caption{Image ALT tag}
\end{figure}
\shorthandon{=}
\end{document}
我應該使用哪種方法? 是否有HTML DOM解析器
允許這種替換
? 還是其他建議?
更新:有什么方法可以在PHP的HTML DOM樹中正常行走嗎? 我嘗試了RecursiveDOMIterator(http://stackoverflow.com/questions/4431142/loop-through-all-elements-of-body-tags-using-dom),但無法獲得成功的結果。
謝謝。
您是否嘗試過PHP簡單HTML DOM解析器 ? 具體來說,“如何遍歷DOM樹?” 手冊中的“部分”可能是您要尋找的。
根據您帖子中HTML結構的復雜程度,您可以使用基於正則表達式的替換(如果標記很簡單,如您的示例所示)。 如果要將復雜的結構(嵌套元素)復制到LaTeX中,則正則表達式可能無法正常工作。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.