繁体   English   中英

如果 sed 空格字符出现在 linux 文件中的双引号内,如何处理

[英]how to sed spacial character if it come inside double quote in linux file

我有一个用逗号 (,) 分隔的 txt 文件,每列用双引号引用

我想要做的是:我需要将分隔符保留为逗号,但我想删除每个逗号进入双引号(因为每列都用双引号引起来)

输入示例和我想要的 output 文件

输入文件:

"2022111812160156601777153","","","false","test1",**"here the , issue , that comma comma come inside the column"**

我想要的 output:

"2022111812160156601777153","","","false","test1",**"here the  issue  that comma comma come inside the column"**

我尝试的是:

sed -i ':a' -e 's/\("[^"]*\),\([^"]*"\)/\1~\2/;ta' test.txt

但上面的 sed 命令不仅替换了列内的逗号,还替换了所有逗号

有办法吗?

使用sed

$ sed -Ei.bak ':a;s/((^|,)(\*+)?"[^"]*),/\1/;ta' input_file
"2022111812160156601777153","","","false","test1",**"here the  issue  that comma comma come inside the column"**

任何时候你发现自己在 sed 中使用的不仅仅是sgp (带-n ),你最好还是使用 awk 以获得清晰度、健壮性、效率、可移植性等的某种组合。

在每个 Unix 框上的任何 shell 中使用任何 awk:

$ awk 'BEGIN{FS=OFS="\""} {for (i=2; i<=NF; i+=2) gsub(/,/,"",$i)} 1' file
"2022111812160156601777153","","","false","test1",**"here the  issue  that comma comma come inside the column"**

就像 GNU sed 在您的问题中有-i使用命令的 output 更新输入文件一样,GNU awk 有-i inplace inplace ,或者只是添加> tmp && mv tmp file与任何 awk 或任何其他 Unix 命令。

这可能对你有用(GNU sed):

sed -E ':a;s/^(("[^",]*"\**,?\**)*"[^",]*),/\1/;ta' file

这遍历每一行,删除成对的双引号字段中的任何逗号。

注意上面的解决方案也适用于以零或*为前缀/后缀的双引号字段。 如果不应该满足这一点,这里有一个改进的解决方案:

 sed -E ':a;s/^(("[^",]*",?)*"[^",]*),/\1/;ta' file

NB 转义双引号和逗号需要一个或多个涉及的正则表达式。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM