繁体   English   中英

如何使用python脚本或Shell在CSV文件的库伦中拆分或切片文本?

[英]How to Split or Slice the text inside a coulmn in CSV file using python script or Shell?

  1. 第1_1368083_US_PBPR_STD行
  2. 行215_1368083_US_PBPR_ENH
  3. 行216_60902413_US_PBPR_ENH
  4. 行227_37758281_US_PBPR_ENH

最终输出应仅为一列1368083数字

使用str.split

s1 = "Row1_1368083_US_PBPR_STD"
s2 ="Row215_1368083_US_PBPR_ENH"

print(s1.split("_")[1])
print(s2.split("_")[1])

输出:

1368083
1368083

或正则表达式。

import re

s1 = "Row216_60902413_US_PBPR_ENH"
s2 ="Row227_37758281_US_PBPR_ENH"

print(re.findall(r"\d{6,}", s1)[0])
print(re.findall(r"\d{6,}", s2)[0])

使用sed提取两个'_'之间的数字部分,

sed 's/^.*_\([0-9]*\)_.*/\1/'

或使用awk提取第二个字段,以'_'分隔,

awk -F'_' '{print $2}'
awk -F_ '$2 ~/1368083/{print $2}' file
1368083
1368083

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM