繁体   English   中英

在数据框列的子集上使用“应用”方法的有效方法是什么?

[英]What is an efficient way to use “apply” method on a subset of dataframe columns?

我有一个数据框,我想在行之间应用“应用”方法,但是我只需要对列的子集(例如60%)执行此操作。 我想知道什么是有效的方法?

我知道我可以使用set_index将其余不需要的列存储到索引中,然后将其重置回去,但是我很好奇是否有更有效的方法可以做到这一点。

我当然可以:

df_new=df[[x1,x2,...xn]].apply(function, axis=0)

但是这样做的问题是df_new丢失了其余的列(和索引),因此很难将其恢复到预期的输出,这是仅将“ apply”应用于仅特定数目的选定列的原始帧。 有什么想法/建议吗?

您可以将结果分配给df的相同子集:

np.random.seed(0)
df = pd.DataFrame(np.random.randn(5, 4))
print(df)
          0         1         2         3
0  1.764052  0.400157  0.978738  2.240893
1  1.867558 -0.977278  0.950088 -0.151357
2 -0.103219  0.410599  0.144044  1.454274
3  0.761038  0.121675  0.443863  0.333674
4  1.494079 -0.205158  0.313068 -0.854096

df[[1, 2]] = df[[1, 2]].apply(lambda x: 100 + x)
print(df)

          0           1           2         3
0  1.764052  100.400157  100.978738  2.240893
1  1.867558   99.022722  100.950088 -0.151357
2 -0.103219  100.410599  100.144044  1.454274
3  0.761038  100.121675  100.443863  0.333674
4  1.494079   99.794842  100.313068 -0.854096

如果要保留原始数据帧,请进行复制。

如果您有混合dtypes,这可能不起作用。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM