繁体   English   中英

如何在python中解析restructuredtext?

[英]How to parse restructuredtext in python?

是否有任何模块可以将重构文本解析为树模型?

docutils或sphinx可以这样做吗?

Docutils确实包含了执行此操作的工具。

你可能想要的是docutils.parsers.rst的解析器

有关所涉及的详细信息,请参阅此页面 docutils/examples.py中也有一些例子 - 特别是检查internals()函数,这可能是有意义的。

我想扩展Gareth Latty的答案。 “你可能想要的是docutils.parsers.rst的解析器”是答案的一个很好的起点,但下一步是什么? 即:

如何在python中解析restructuredtext?

下面是Python 3.6和docutils 0.14的确切答案:

import docutils.nodes
import docutils.parsers.rst
import docutils.utils

def parse_rst(text: str) -> docutils.nodes.document:
    parser = docutils.parsers.rst.Parser()
    components = (docutils.parsers.rst.Parser,)
    settings = docutils.frontend.OptionParser(components=components).get_default_values()
    document = docutils.utils.new_document('<rst-doc>', settings=settings)
    parser.parse(text, document)
    return document

并且可以使用例如下面的处理来处理结果文档,这将打印文档中的所有引用:

class MyVisitor(docutils.nodes.NodeVisitor):

    def visit_reference(self, node: docutils.nodes.reference) -> None:
        """Called for "reference" nodes."""
        print(node)

    def unknown_visit(self, node: docutils.nodes.Node) -> None:
        """Called for all other node types."""
        pass

以下是如何运行它:

doc = parse_rst('spam spam lovely spam')
visitor = MyVisitor(doc)
doc.walk(visitor)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM