DataFrame python中列的順序名稱

Question

我在蟒蛇工作。 我有一個大的 DataFrame df1 ( 25000 x 484 )，除了前 4 列之外，所有其他列都可以分為 4 列並具有序列號。 需要明確的是，不考慮前 4 列，這就是列標題的樣子：

comp_type_1 / tag_1 / length_1 / value_1 / comp_type_2 / tag_2 / length_2 / value_2 / comp_type_3 / tag_3 / length_3 / value_3 ....

我想創建df2以便它只包含列lenght_i ，其中 i 從 1 到最后一個數字（120。有沒有辦法意識到考慮到列名稱的那部分是相同的，以及有什么變化只是一個數字嗎？

謝謝！

Answer 1

如果我正確理解了這個問題，這就是你要找的。

# setup
df = pd.DataFrame(np.random.randint(0,100,size=(3, 12)), columns=["comp_type_1", "tag_1", "length_1", "value_1", "comp_type_2", "tag_2", "length_2", "value_2", "comp_type_3", "tag_3", "length_3", "value_3"])

# column filter 
df2 = df[[_ for _ in df.columns if 'length' in _]]

輸出 ( df2 )

    length_1    length_2    length_3
0   91          81          23
1   42          92          50
2   61          79          76

Answer 2

給定數據框df您可以對列進行過濾：

df = df.filter(regex=("length"))

DataFrame python中列的順序名稱

問題描述

2 個解決方案

解決方案1
1 已采納 2020-02-21 16:52:55

解決方案2
0 2020-02-21 17:00:54

DataFrame python中列的順序名稱

問題描述

2 個解決方案

解決方案1 1 已采納 2020-02-21 16:52:55

解決方案2 0 2020-02-21 17:00:54

解決方案1
1 已采納 2020-02-21 16:52:55

解決方案2
0 2020-02-21 17:00:54