如何從python代碼的輸出中刪除“ _”？

Question

我寫了一個python代碼，最終輸出中帶有'_'符號。 所以我想刪除這個符號。

import re
from itertools import groupby

file = ["meta_data_02154.csv", "meta_data_021694.csv", "meta_data_loop_02365.csv", "meta_data_loops_0256365.csv", "output.csv"]

f = [list(i) for j, i in groupby(file, lambda a : re.split(r'\d*.csv$', a)[0])]
print(f)

for pattern in f:
        #print(pattern)
        print((re.split(r'\d*.csv$', pattern[0]))[0])

輸出：

[['meta_data_02154.csv', 'meta_data_021694.csv'], ['meta_data_loop_02365.csv'], ['meta_data_loops_0256365.csv'], ['output.csv']]
meta_data_
meta_data_loop_
meta_data_loops_
output

需求輸出：

[['meta_data_02154.csv', 'meta_data_021694.csv'], ['meta_data_loop_02365.csv'], ['meta_data_loops_0256365.csv'], ['output.csv']]
meta_data
meta_data_loop
meta_data_loops
output

Answer 1

使用rstrip（）

import re
from itertools import groupby

file = ["meta_data_02154.csv", "meta_data_021694.csv", "meta_data_loop_02365.csv", "meta_data_loops_0256365.csv", "output.csv"]

f = [list(i) for j, i in groupby(file, lambda a : re.split(r'\d*.csv$', a)[0])]
print(f)

for pattern in f:
        #print(pattern)
        print((re.split(r'\d*.csv$', pattern[0]))[0].rstrip('_'))

Answer 2

使用rstrip()

val = "sad_"
print(val.rstrip('_'))
Output: sad

描述

rstip()返回字符串的副本，其中刪除了右尾字符。

另外，在這種情況下， print(val[:-1])將得到相同的結果。

Answer 3

嘗試使用模式r'_?\\d*.csv$' 。

例如：

import re
from itertools import groupby

file = ["meta_data_02154.csv", "meta_data_021694.csv", "meta_data_loop_02365.csv", "meta_data_loops_0256365.csv", "output.csv"]

f = [list(i) for j, i in groupby(file, lambda a : re.split(r'\d*.csv$', a)[0])]
print(f)

for pattern in f:
    #print(pattern)
    print((re.split(r'_?\d*.csv$', pattern[0]))[0])

Answer 4

您可以使用print((re.split(r'\\d*.csv$', pattern[0]))[0].rstrip('_')但也可以使用更好的正則表達式和.search代替split 。

我不確定您使用groupby的目的。

import re

file = ["meta_data_02154.csv", "meta_data_021694.csv", "meta_data_loop_02365.csv", "meta_data_loops_0256365.csv", "output.csv"]

for pattern in file:
    print(re.search(r'(.+)\d*.csv$', pattern).group(1))

輸出

meta_data_02154
meta_data_021694
meta_data_loop_02365
meta_data_loops_0256365
output

Answer 5

您可以使用單線，僅拆分文件名：

file = ["meta_data_02154.csv", "meta_data_021694.csv", "meta_data_loop_02365.csv", "meta_data_loops_0256365.csv", "output.csv"]
filePatterns = set([f.rsplit('_', 1)[0].rsplit('.csv')[0] for f in file])
print(filePatterns)

打印：

{'meta_data_loops', 'meta_data', 'meta_data_loop', 'output'}

如何從python代碼的輸出中刪除“ _”？

問題描述

5 個解決方案

解決方案1
2 已采納 2019-09-13 09:41:52

解決方案2
1 2019-09-13 09:41:52

解決方案3
0 2019-09-13 09:44:05

解決方案4
0 2019-09-13 09:46:56

解決方案5
0 2019-09-13 09:49:42

如何從python代碼的輸出中刪除“ _”？

問題描述

5 個解決方案

解決方案1 2 已采納 2019-09-13 09:41:52

解決方案2 1 2019-09-13 09:41:52

解決方案3 0 2019-09-13 09:44:05

解決方案4 0 2019-09-13 09:46:56

解決方案5 0 2019-09-13 09:49:42

解決方案1
2 已采納 2019-09-13 09:41:52

解決方案2
1 2019-09-13 09:41:52

解決方案3
0 2019-09-13 09:44:05

解決方案4
0 2019-09-13 09:46:56

解決方案5
0 2019-09-13 09:49:42