[英]Multiple column names in Pandas DataFrame
我目前正在将一些数据从numpy数组移动到Pandas DataFrame,以便可以按列名而不是索引来引用列。 我的问题是我想允许多个名称引用同一列。
data = np.array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
df = pd.DataFrame(data, columns=('Sensor1231', 'Sensor4221', 'Sensor4673'))
例如,Sensor4221是结构第五层的加速度计。 我想添加一个附加标签(例如AccLevel5),以便我可以参考该列而不必记住一个晦涩的传感器编号。
因此,以下两个将提供相同的输出。
Accel = df['Sensor4221']
和
Accel = df['AccLevel5']
两者都给:
2
5
8
数据框是numpy数组的包装。 您可以分配另一个指向同一数组的数据框来实现您的目标。
data = np.array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
df = pd.DataFrame(data, columns=('Sensor1231', 'Sensor4221', 'Sensor4673'))
df2 = pd.DataFrame(df.values, df.index,
columns=('Sensor1231', 'AccLevel5', 'Sensor4673'))
df
df2
现在在df
重新分配元素并查看df2
的更改
df.loc[1, 'Sensor4221'] = 999
df2
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.