使用lxml为Wordpress Importer编写自定义XML文件

Question

好的，这是我目前的情况：

我对XML或lxml的了解还不是很好，因为到目前为止我很少使用XML文件。 因此，请告诉我在解决这个问题时是否真的很愚蠢。 ;-)

我想使用Wordpress导入程序为我的Wordpress安装提供一个自定义XML文件。 可以在此处看到默认格式： XML文件

现在有些标签看起来像这样

<wp:author>

我不是百分百确定的，但是据我今天的了解，wp：标签的一部分是名称空间。

当我尝试使用lxml创建那些标签时，我这样做了

author = etree.Element("wp:author")

这引起了一个错误，因为我不允许写wp：author，而只能写作者。 我使用Google，查看了lxml网站，并提出了以下内容：

WP = ElementMaker(namespace="http://wordpress.org/export/1.2/",
                  "nsmap={'wp' : "http://wordpress.org/export/1.2/"})
author = WP("author")

输出：

<wp:author xmlns:wp="http://wordpress.org/export/1.2/"/>

好吧，更好。 正如我今天所学的，xmlns：wp属于名称空间。 但是我不希望出现xmlns：wp东西，因为它不在他们的XML文件中。 我查看了Wordpress本身是如何导出其内容的，并且这样做是这样的：

echo '<wp:author_id>' . $author->ID . '</wp:author_id>';

现在我的问题是，像他们一样做还是更好？还是我应该坚持使用lxml，只要有一种方法可以获取没有xmlns：wp内容的标签？ 使用lxml创建XML文件似乎是更好的方法，因为它（通常）非常容易且易于阅读。

我已经尝试过objectify.deannotate，cleanup_namespace和类似的建议，但是所有这些都不起作用。 我希望你们中的一些人有一个答案，可以使用lxml为我的问题提出解决方案，或者说可以像Wordpress员工那样更好地做到这一点！

如果我忽略了一个已经回答过的类似问题，我真的很抱歉，请告诉我。

谢谢Vaelor

Answer 1

这是我的建议：从lxml退后一步，考虑python对xml处理的内置支持：一个名为xml.etree.ElementTree的模块。 像这样在repl中导入它：

import xml.etree.ElementTree as ET

并玩一会儿。 这是该模块上的优质python文档： http : //goo.gl/8FVto

构建元素非常简单：

a = ET.Element('wp:author')
ET.dump(a)

然后添加一些子元素。 全部在文档中。

使用lxml为Wordpress Importer编写自定义XML文件

问题描述

1 个解决方案

解决方案1
2 已采纳 2013-10-19 05:41:08

使用lxml为Wordpress Importer编写自定义XML文件

问题描述

1 个解决方案

解决方案1 2 已采纳 2013-10-19 05:41:08

解决方案1
2 已采纳 2013-10-19 05:41:08