[英]Renaming multiple columns in dataframe
我有一個大的數據框為:
z1.ix[1:2]
index LocalTime Temp TempDiff TempNormal DewPoint
1 5/16/2018 1:00:00 AM 66.92 -3.89 55.22 66.92 NaN
2 5/16/2018 2:00:00 AM 66.92 -3.31 53.47 66.02 NaN
以上是使用pandas.read_csv
生成的
如何重命名列,使其顯示如下:
z1.ix[1:2]
LocalTime Temp TempDiff TempNormal DewPoint
1 5/16/2018 1:00:00 AM 66.92 -3.89 55.22 66.92
2 5/16/2018 2:00:00 AM 66.92 -3.31 53.47 66.02
列名左移一位,最后一列被刪除。
df.rename(columns={'oldCol':'newCol'})
重命名列是一種繁瑣的方法,因為z1的列數約為300。
編輯:我的csv文件具有:
NA-KBWI Hourly Forecast Made May 16 2018 1510 UTC
LocalTime Temp TempDiff TempNormal DewPoint Cloud Cover FeelsLikeTemp
5/16/2018 0:00 68 -3.38 57.5 66.92 100 68
5/16/2018 1:00 66.92 -3.89 55.22 66.92 100 66.92
5/16/2018 2:00 66.92 -3.31 53.47 66.02 100 66.92
5/16/2018 3:00 66.92 -2.37 52.88 66.02 100 66.92
我正在使用以下代碼:
pandas.read_csv('myCSV.csv', skiprows=[0])
關於什么
df.drop('DewPoint', axis=1)
.rename(columns=dict(zip(df.columns[:-1],df.columns[1:])))
你可以這樣做:
df.columns = df.columns[1:].tolist() + ['DropMe']
df.drop('DropMe', axis=1, inplace=True)
輸出:
Temp TempDiff TempNormal DewPoint
1 5/16/2018 1:00:00 AM 66.92 -3.89 55.22
2 5/16/2018 2:00:00 AM 66.92 -3.31 53.47
考慮下面的代碼:
new_col = list(pd.Series(list(df.columns)).shift(-1).dropna())
df = df.drop(list(df.columns)[-1], axis=1)
df.columns = new_col
更容易的是在read_csv命令中使用標志index_col = False
,並且應該從一開始就避免此問題。
否則,您可以執行以下操作:
old_cols = df.columns.values
#delete the right-most row, which for you is NaN
del df[old_cols[-1]]
new_cols = old_cols[1:]
df.columns = new_cols
從我收集到的信息中,您正嘗試將所有列名下移。
rename_dict = {}
for i in range(len(z1.keys()) - 1):
rename_dict[z1.keys()[i]] = z1.keys()[i+1]
z1.index.names = [z1.keys()[0]]
z1 = z1.drop(df.keys()[-1], axis=1)
print(rename_dict)
z1.rename(columns=rename_dict)
這應該可以解決問題
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.