我的xml数据如下,

在此处输入图片说明

我希望输出数据帧为

英语 马拉地语
prompt_username वापरकर्त्याचेनाव
物品 आगमन चेतावणी

输出是一种英语到马拉地语表。

我尝试使用以下代码:

xml_file = et.parse("strings_Marathi.xml")
for item in xml_file.iterfind('string name='):
    print(item)

我可以找到 string 标签,但如何提取 string name="" ?

有人可以帮我弄这个吗。

谢谢。

#1楼 票数:1 已采纳

name是元素string一个属性。 要获取属性值,请使用属性.attrib ,它是一个字典。

from xml.etree import ElementTree as ET
from io import StringIO

data = '''\
<foo>
<string name="abc">123</string>
<string name="def">456</string>
<string>789</string>
<string name="jkl">000</string>
</foo>
'''

f = StringIO(data)
tree = ET.parse(f) # replace with ET.parse("strings_Marathi.xml") to load your file

for tag in tree.iterfind('.//string[@name]'):
    print(tag.attrib['name'], tag.text)

  ask by Krish1992 translate from so

未解决问题?本站智能推荐:

1回复

从给定标签读取 xml 文件

在我的情况下,如何从给定的标签“自然”中读取 xml。 我下面的代码读取了整个 xml 文件。 请问谁能帮帮我?
1回复

用 Pandas 读取 xml 文件

我想读取一个 xml 文件到熊猫。 这是示例 XML 文件 这是我尝试过的 但我不知道如何继续并从itemlist获取值。 当我打印它时,我用于以下输出 我怎样才能从中取出字符串?
1回复

熊猫读取xml时出现奇怪的标签不匹配错误

我一直在使用包pandas_read_xml将 XML 文件读入熊猫数据帧。 但是,我最近开始体验这个包的非常奇怪的行为。 xml 解析器偶尔会崩溃,但经过反复尝试,它可以工作。 我真的对此感到困惑,所以我希望这里的任何人都可以帮助我解决这个问题。 我将尝试说明我在下面面临的问题。 这偶尔会返
1回复

如何从熊猫中的给定行和列开始读取Excel文件

我如何从行和列开始读取大熊猫中的excel文件,我想删除一些行和列,说我的excel文件在开始的行和列中包含一些随机数据,因此我想从给定行,c列或删除几行和几列。 我该如何实现? 通常,我希望我的行从B21开始,将所有内容拖放到第20行和A列。请帮助。
1回复

根据列中的特定标签向前填充熊猫数据框

我需要向前感受特定标签内的数据(其中在其他列中定义的标签: 需要这样的: 到目前为止,我唯一的想法是按标签使用groupby ,然后ffill每个组,然后再将所有内容ffill 。 是否有其他更明确的解决方案?
4回复

在pandas中读取csv时自动确定标题行

我正在尝试从共享相同列名的不同 .csv 文件中收集数据。 但是,某些 csv 文件的标题位于不同的行中。 有没有办法根据包含“最多”值(实际标题名称)的第一行动态确定标题行? 我尝试了以下方法: 但是,当使用pandas.read_csv() ,似乎第一个值决定了实际数据帧的大小,因为我收
1回复

如何仅过滤包含给定标签列表中任何值的那些行

数据框 我有这个数据框,其中包含与用户相关的用户 ID 和标签。 仅过滤掉那些标签包含此列表中任何一项的行的最佳方法是什么。 data_science = ['python', 'r', 'matlab', 'sas', 'excel', 'sql'] 我在 Pandas 中尝试了以下代码,它确实
2回复

熊猫读取“分隔”文件

嗨,我有这样的.txt文件,第一列代表索引,后面是一对“()”内的三列代表x,y和z坐标。 我想将此文件的前四列加载到pandas Dataframe。 然而,我发现这很难,因为分隔符首先是“”然后“(”并且在括号内有“,”。 有人能给我一些如何处理这种情况的暗示吗?