簡體   English   中英

DataFrame python中列的順序名稱

[英]Sequential name of column in a DataFrame python

我在蟒蛇工作。 我有一個大的 DataFrame df1 ( 25000 x 484 ),除了前 4 列之外,所有其他列都可以分為 4 列並具有序列號。 需要明確的是,不考慮前 4 列,這就是列標題的樣子:

comp_type_1 / tag_1 / length_1 / value_1 / comp_type_2 / tag_2 / length_2 / value_2 / comp_type_3 / tag_3 / length_3 / value_3 ....

我想創建df2以便它只包含列lenght_i ,其中 i 從 1 到最后一個數字(120。有沒有辦法意識到考慮到列名稱的那部分是相同的,以及有什么變化只是一個數字嗎?

謝謝!

如果我正確理解了這個問題,這就是你要找的。

# setup
df = pd.DataFrame(np.random.randint(0,100,size=(3, 12)), columns=["comp_type_1", "tag_1", "length_1", "value_1", "comp_type_2", "tag_2", "length_2", "value_2", "comp_type_3", "tag_3", "length_3", "value_3"])

# column filter 
df2 = df[[_ for _ in df.columns if 'length' in _]]

輸出 ( df2 )

    length_1    length_2    length_3
0   91          81          23
1   42          92          50
2   61          79          76

給定數據框df您可以對列進行過濾:

df = df.filter(regex=("length"))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM