最好使用perl或unix命令来解析此字符串

Question

是否有一个好的UNIX内衬或perl内衬可以格式化以下字符串：

<?xml version="1.0" encoding="UTF-8"?><org.apache.Summary length="200429142" fileCount="197184" dirCount="50" quota="-1" spaceUsed="601287428" spaceQuota="-1"/>

至：

length=200429142
filecount=197184
dirCount=50
quota=-1
spaceUsed=601287428
spaceQuota=-1

Answer 1

这是一个单线，为了清晰起见，分为几行：

perl -MXML::Simple -l \
    -e '$a = XMLin shift; print "$_=$a->{$_}" for ' \
    -e 'qw(length fileCount dirCount quota spaceUsed spaceQuota)' \
    (your XML string here)

这要求您已安装XML::Simple模块。

Answer 2

只是一个快速镜头：那呢？

sed -r 's/.*<org.apache.Summary\s+([^>]+)>/\1/' | tr " " "\n"

Answer 3

 sed -e 's/.*Summary //;s/\/.*$//' temp|perl -p -e 's/ /\n/g'

length="200429142"
fileCount="197184"
dirCount="50"
quota="-1"
spaceUsed="601287428"
spaceQuota="-1"

如果您想就位：

sed -e 's/.*Summary //;s/\/.*$//' temp|perl -pi -e 's/ /\n/g'

如果您不需要"则：

 sed -e 's/.*Summary //;s/\/.*$//' temp|perl -p -e 's/ /\n/g;s/\"//g'
length=200429142
fileCount=197184
dirCount=50
quota=-1
spaceUsed=601287428
spaceQuota=-1

Answer 4

基于@bmk的精炼版本

sed -r 's/<\?.?*\?>//' | sed -r 's/<[a-z\.]+//I' | \
sed -r 's/\/>//' | sed -r 's/ ([a-z]+)="(-?[0-9]+)"/\1=\2\n/Ig'

总共使用了4 sed 。

删除<?xml?>
删除<org.apache.Summary
删除/>
将XML属性成对提取。

Answer 5

这应该做您需要的。

perl -0777 -E'given(<>){/\?>/g; say "$1$2" while /(\w+=)"(.*?)"/g}' myfile.xml

输出

length=200429142
fileCount=197184
dirCount=50
quota=-1
spaceUsed=601287428
spaceQuota=-1

最好使用perl或unix命令来解析此字符串

问题描述

5 个解决方案

解决方案1
6 2011-04-19 20:50:54

解决方案2
3 2011-04-19 20:54:07

解决方案3
2 2011-04-20 07:46:45

解决方案4
1 2011-04-20 03:40:11

解决方案5
0 2012-07-13 22:44:47

最好使用perl或unix命令来解析此字符串

问题描述

5 个解决方案

解决方案1 6 2011-04-19 20:50:54

解决方案2 3 2011-04-19 20:54:07

解决方案3 2 2011-04-20 07:46:45

解决方案4 1 2011-04-20 03:40:11

解决方案5 0 2012-07-13 22:44:47

解决方案1
6 2011-04-19 20:50:54

解决方案2
3 2011-04-19 20:54:07

解决方案3
2 2011-04-20 07:46:45

解决方案4
1 2011-04-20 03:40:11

解决方案5
0 2012-07-13 22:44:47