[英]Utilize lambda function to optimize matrix math - Pandas
我有一個數據框列表,每個都具有相同的形狀: 24783 x 89731
。 其中有 6 個,在list
dfs
中
目標是,對於不是目標列的每一列,將其他列乘以目標。 所以我有一個雙循環,如:
for df in dfs:
for col in df.columns:
if col != 'target':
df[col] *= df['target']
else:
continue
然而,這是非常低效的,因為處理這么多數據需要幾個小時(到目前為止 1.5 小時)。
無論如何我可以使用lambda
或類似的快遞來加快速度,或提高我的效率?
您可以嘗試減少一個 for 循環
for df in dfs:
df.update(df.drop('target',axis=1).mul(df.target,axis=0))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.