[英]Slicing a Pandas DataFrame into a new DataFrame
我想使用布尔索引对DataFrame进行切片,以获取副本,然后独立于原始DataFrame在该副本上执行操作。
从这个答案来看,使用布尔数组选择.loc
会给我一个副本,但是,如果我尝试更改副本, SettingWithCopyWarning
会妨碍您。 那么这将是正确的方法:
import numpy as np
import pandas as pd
d1 = pd.DataFrame(np.random.randn(10, 5), columns=['a', 'b', 'c', 'd', 'e'])
# create a new dataframe from the sliced copy
d2 = pd.DataFrame(d1.loc[d1.a > 1, :])
# do stuff with d2, keep d1 unchanged
您需要使用boolean indexing
copy
,不需要新的DataFrame
构造函数:
d2 = d1[d1.a > 1].copy()
警告说明:
如果以后在d2
修改值,您会发现修改不会传播回原始数据( d1
),并且Pandas会发出警告。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.