使用Python從XML文件中提取信息？

Question

在使用Python從XML文件中提取信息方面，誰能提供一些幫助？ 這將是我的示例XML。

<root>
    <number index="2">
        <info>
            <info.RANDOM>Random Text</info.RANDOM>
        </info>
</root>

我要打印的是根標簽之間的信息。 但是，我希望它按原樣打印它，這意味着我嘗試了itertext（）來表示所有標簽，標簽之間的文本以及標簽內的內容（在這種情況下為number index =“ 2”），但是這樣可以刪除標簽，並僅打印根標簽之間的文本。 到目前為止，我有一個臨時解決方案，該解決方案僅打印出element.tag和element.text，但不打印出結束標記和標記中的內容。 任何幫助，將不勝感激！ :)

Answer 1

以s作為輸入，

s='''<root>
      <number index="2">
        <info>
            <info.RANDOM>Random Text</info.RANDOM>
        </info>
        </number>
</root>'''

查找具有標簽名稱number所有標簽，然后使用ET.tostring（）將標簽轉換為字符串

import xml.etree.ElementTree as ET
root = ET.fromstring(s)
for node in root.findall('.//number'):
  print ET.tostring(node)

輸出：

<number index="2">
        <info>
            <info.RANDOM>Random Text</info.RANDOM>
        </info>
        </number>

Answer 2

from bs4 import BeautifulSoup

xml = "<root><number index=\"2\"><info><info.RANDOM>Random Text</info.RANDOM></info></root>"
soup = BeautifulSoup(xml, "xml")

output = soup.prettify()
print(output[output.find("<root>") + 7:output.rfind("</root>")])

root>\\n的+ 7帳戶root>\\n

使用Python從XML文件中提取信息？

問題描述

2 個解決方案

解決方案1
1 已采納 2017-05-15 16:24:13

解決方案2
0 2017-05-15 17:52:16

使用Python從XML文件中提取信息？

問題描述

2 個解決方案

解決方案1 1 已采納 2017-05-15 16:24:13

解決方案2 0 2017-05-15 17:52:16

解決方案1
1 已采納 2017-05-15 16:24:13

解決方案2
0 2017-05-15 17:52:16