[英]pandas dataframe slicing produce different results
我正在尝试通过将数据帧切片传递给函数来对加速度计数据进行带通滤波,但是基于切片数据的方式,我得到了不同的结果
我尝试使用iloc
使用列名和索引,但是结果不同,所以我不认为哪个结果是正确的结果
我的带通滤波器功能:
def butter_bandpass(lowcut, highcut, fs, order=6):
nyq = 0.5 * fs
low = lowcut / nyq
high = highcut / nyq
b, a = butter(order, [low, high], btype='band')
return b, a
def butter_bandpass_filter(data, lowcut, highcut, fs):
b, a = butter_bandpass(lowcut, highcut, fs, order=6)
y = lfilter(b, a, data)
return y
在以下两种方式下,我曾经将数据传递给函数:第一种方式:将tremor_0[['X']] as [[]]
切片列名
y=pd.DataFrame(data=butter_bandpass_filter(tremor_0[['X']],0.3,12,100),columns=['X'])
第二种方式:使用tremor_0['X'] as []
列名称切片
y=pd.DataFrame(data=butter_bandpass_filter(tremor_0['X'],0.3,12,100),columns=['X'])
第一种方法的结果:
X
0 -0.001962
1 -0.001962
2 -0.001948
3 -0.001903
4 -0.001874
第二种方式的结果:
X
0 -0.001962
1 -0.019822
2 -0.095867
3 -0.298136
4 -0.675933
请注意,从第二行开始,值是不同的,那么哪种方法是正确的方法,为什么?
简短的答案 :使用tremor_0['X']
。
长答案
首先, tremor_0[['X']]
和tremor_0['X']
不相同。
假设您有一个数据框:
df = pd.DataFrame(np.ndarray((100, 10)), columns=['x_%i' % i for i in range(10)])
type(df[['x_0']])
# pandas.core.frame.DataFrame
type(df['x_0'])
# pandas.core.series.Series
更重要的是,它们具有不同的形状
df[['x_0']].shape
# (100, 1)
df['x_0'].shape
# (100, )
scipy.signal.lfilter
处理方式不同,因为它将filter应用于axis=-1
。
axis:int,可选 。沿其应用线性滤波器的输入数据数组的轴。 过滤器沿此轴应用于每个子数组。 默认值为-1。
如果将lfilter
参数更改为axis = 0
, butter_bandpass_filter
返回带有样本值的数组。 但是请记住,结果数组将遵循输入的形状。
当您使用tremor_0[['X']]
您将得到一个数据框对象,该对象是一个数组。 当您使用tremor_0['X']
会获得一个Series对象,该对象可以轻松转换为列表
如果您只是尝试从一维列中提取数据,请使用tremor_0['X']
但是您应该验证给出的数据有意义的结果以及您要实现的结果
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.