[英]Pandas dropping columns and rows from a dataframe that came from Excel
我試圖在數據幀中刪除一些無用的列,但我收到錯誤:“數組的索引太多”
這是我的代碼:
import pandas as pd
def answer_one():
energy = pd.read_excel("Energy Indicators.xls")
energy.drop(energy.index[0,1], axis = 1)
answer_one()
選項1
切片索引時語法錯誤,它應該是列
import pandas as pd
energy = pd.read_excel("Energy Indicators.xls")
energy.drop(energy.columns[[0,1]], axis=1)
選項2
我會這樣做的
import pandas as pd
energy = pd.read_excel("Energy Indicators.xls")
energy.iloc[:, 2:]
我認為在解析/讀取Excel文件時最好跳過不需要的列:
energy = pd.read_excel("Energy Indicators.xls", parse_cols='C:ZZ')
如果您嘗試刪除列,則需要更改語法。 您可以通過標題或索引來引用它們。 以下是按名稱引用它們的方法。
import pandas as pd
energy = pd.read_excel("Energy Indicators.xls")
energy.drop(['first_colum', 'second_column'], axis=1, inplace=True)
另一種解決方案是首先將它們排除在外:
energy = pd.read_excel("Energy Indicators.xls", usecols=[2:])
這也有助於加快導入速度。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.