[英]Slice multiple column ranges with Pandas
假設我在數據集中有20列,並且我想使用19列作為輸入。 輸入列是從1:10到12:20的列。我想使用第11列作為輸出。 那么如何使用熊貓給這種距離呢?
例如: 示例數據集
考慮上述數據,它有4列,但我只需要輸入3列,但這些列是b,d,e,而我想跳過c列。 現在,im使用input = dftrain.loc [:, :'e' ]來考慮所有4列。
選項1
np.r_
idx = np.r_[0:11, 12:20]
idx
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 13, 14, 15, 16, 17,
18, 19])
將此傳遞給iloc
df.iloc[:, 11] = df.iloc[:, idx].sum(axis=1) # sum, for example
選項2
pd.IndexSlice
idx = pd.IndexSlice[0:11, 12:20]
idx
(slice(0, 11, None), slice(12, 20, None))
您可以像以前一樣使用idx
。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.