[英]Python + Pandas + Dataframe : Generating dynamic column name for Pandas dataframe column
[英]Sequential name of column in a DataFrame python
我在蟒蛇工作。 我有一個大的 DataFrame df1
( 25000 x 484 ),除了前 4 列之外,所有其他列都可以分為 4 列並具有序列號。 需要明確的是,不考慮前 4 列,這就是列標題的樣子:
comp_type_1 / tag_1 / length_1 / value_1 / comp_type_2 / tag_2 / length_2 / value_2 / comp_type_3 / tag_3 / length_3 / value_3 ....
我想創建df2
以便它只包含列lenght_i ,其中 i 從 1 到最后一個數字(120。有沒有辦法意識到考慮到列名稱的那部分是相同的,以及有什么變化只是一個數字嗎?
謝謝!
如果我正確理解了這個問題,這就是你要找的。
# setup
df = pd.DataFrame(np.random.randint(0,100,size=(3, 12)), columns=["comp_type_1", "tag_1", "length_1", "value_1", "comp_type_2", "tag_2", "length_2", "value_2", "comp_type_3", "tag_3", "length_3", "value_3"])
# column filter
df2 = df[[_ for _ in df.columns if 'length' in _]]
輸出 ( df2
)
length_1 length_2 length_3
0 91 81 23
1 42 92 50
2 61 79 76
給定數據框df
您可以對列進行過濾:
df = df.filter(regex=("length"))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.