创建bash脚本以将xml文件解析为csv

Question

我正在尝试创建一个bash脚本来解析xml文件并将其保存到csv文件。

例如：

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
    <List>
    <Job id="1" name="John/>
    <Job id="2" name="Zack"/>
    <Job id="3" name="Bob"/>
</List>

我希望脚本将信息保存到这样的csv文件中：

John | 1
Zack | 2
Bob  | 3

名称和ID将在其他单元格中。

有什么办法可以做到吗？

Answer 1

你已经张贴类似的查询透水一个。 我再次建议使用XML解析器。 你可以说：

xmlstarlet sel -t -m //List/Job -v @name -o "|" -v @id -n file.xml

它会回来

John|1
Zack|2
Bob|3

为您的样本数据。

如果希望像示例中那样显示输出，请将其通过管道传递到sed ： sed "s/|/\\t| /" 。

Answer 2

试试这个

#!/bin/bash
while read -r line; do
  [[ $line =~ "name=\""(.*)"\"" ]] && name="${BASH_REMATCH[1]}" && [[ $line =~ "Job id=\""([^\"]+) ]] &&  echo "$name | ${BASH_REMATCH[1]}"
done < file

与John的台词格式错误。 固定后，示例输出

John | 1
Zack | 2
Bob | 3

Answer 3

使用sed

sed -nr 's/.*id=\"([0-9]*)\"[^\"]*\"(\w*).*/\2 | \1/p' file

另外，基于BroSlow的版本，我合并了选项。

#!/bin/bash

while read -r line; do
  [[ $line =~ id=\"([0-9]+).*name=\"([^\"|/]*) ]] && echo "${BASH_REMATCH[2]} | ${BASH_REMATCH[1]}"
done < file

Answer 4

扩展xmlstarlet方法：

给定此xml文件作为输入：

<DATA>
  <RECORD>
    <NAME>John</NAME>
    <SURNAME>Smith</SURNAME>
    <CONTACTS>
      "Smith" LTD,
      London, Mtg Str, 12,
      UK
    </CONTACTS>
  </RECORD>
</DATA>

这个脚本：

xmlstarlet sel -e utf-8 -t \
  -o "NAME, SURNAME, CONTACTS" -n \
  -m //DATA/RECORD \
  -o "\"" \
  -v $"str:replace(normalize-space(NAME), '\"', '\"\"')" -o "\",\"" \
  -v $"str:replace(normalize-space(SURNAME),      '\"', '\"\"')" -o "\",\"" \
  -v $"str:replace(normalize-space(CONTACTS), '\"', '\"\"')" -o "\",\"" \
  -o "\"" \
  -n file.xml

您将获得以下输出：

NAME, SURNAME, CONTACTS
"John", "Smith", """Smith"" LTD, London, Mtg Str, 12, UK"

创建bash脚本以将xml文件解析为csv

问题描述

4 个解决方案

解决方案1
4 2014-02-02 06:57:51

解决方案2
2 2014-02-02 06:40:22

解决方案3
1 2014-02-02 10:30:37

解决方案4
1 2017-10-26 00:24:19

创建bash脚本以将xml文件解析为csv

问题描述

4 个解决方案

解决方案1 4 2014-02-02 06:57:51

解决方案2 2 2014-02-02 06:40:22

解决方案3 1 2014-02-02 10:30:37

解决方案4 1 2017-10-26 00:24:19

解决方案1
4 2014-02-02 06:57:51

解决方案2
2 2014-02-02 06:40:22

解决方案3
1 2014-02-02 10:30:37

解决方案4
1 2017-10-26 00:24:19