按数字访问最右边的两列熊猫数据框

Question

我希望在满足条件时覆盖df一些值。 使用下面的df ，当col B等于lst值时，我想用X替换col C,D值。

这可以使用下面的方法来实现，但我希望使用索引来选择最后两列，而不是使用硬编码标签。

df = pd.DataFrame({   
    'A' : [1,1,1,1,1,1,1,1],             
    'B' : ['X','Foo','X','Cat','A','A','X','D'],                 
    'C' : [1,1,1,1,1,1,1,1],    
    'D' : [1,1,1,1,1,1,1,1],            
    })

lst = ['Foo','Cat']
df.loc[df.B.isin(lst), ['C','D']] = 'X'

试图：

df.loc[df.B.isin(lst), df.loc[:-2]] = 'X'

故意的：

   A    B  C  D
0  1    X  1  1
1  1  Foo  X  X
2  1    X  1  1
3  1  Cat  X  X
4  1    A  1  1
5  1    A  1  1
6  1    X  1  1
7  1    D  1  1

Answer 1

如果我理解了这个问题，看起来您正在搜索iloc ：

df.iloc[df.B.isin(lst).values, -2:] = 'X'

在大多数情况下， df.loc[df.B.isin(lst), -2:] = 'X'也将返回相同的结果，但-2: slice 的解释会因列名称为整数类型而有所不同.

Answer 2

这是我对 pandas-y 方法的最佳尝试，下面是超级丑陋且性能较差的apply方法：

import pandas as pd

df = pd.DataFrame({   
    'A' : [1,1,1,1,1,1,1,1],             
    'B' : ['X','Foo','X','Cat','A','A','X','D'],                 
    'C' : [1,1,1,1,1,1,1,1],    
    'D' : [1,1,1,1,1,1,1,1],            
})

# get working index once,
# where column "B" in lst,
# store
ind = df["B"].isin(lst)

# get working slice with index
df_slice = df[ind]

# set the "C" and "D" columns
df_slice["C"], df_slice["D"] = "X", "X"

# set the original df slice
# to our working slice
df[df.B.isin(lst)] = df_slice

print(df)

### PRINTS:

   A    B  C  D
0  1    X  1  1
1  1  Foo  X  X
2  1    X  1  1
3  1  Cat  X  X
4  1    A  1  1
5  1    A  1  1
6  1    X  1  1
7  1    D  1  1

这是逐行apply方法。 这不是最漂亮的解决方案，但它完成了工作。 请注意，这只是用 Xs 替换了行的其余部分。

import pandas as pd

df = pd.DataFrame({   
    'A' : [1,1,1,1,1,1,1,1],             
    'B' : ['X','Foo','X','Cat','A','A','X','D'],                 
    'C' : [1,1,1,1,1,1,1,1],    
    'D' : [1,1,1,1,1,1,1,1],            
})


def apply_function(row):
    lst = ['Foo','Cat']
    return row if row["B"] not in lst else [
        # first two rows
        *row[:2],
        # Xs for the rest of the row
        *["X" for r in range(len(row) - 2)]
    ]

df = df.apply(apply_function, axis=1)
print(df)

### PRINTS:

   A    B  C  D
0  1    X  1  1
1  1  Foo  X  X
2  1    X  1  1
3  1  Cat  X  X
4  1    A  1  1
5  1    A  1  1
6  1    X  1  1
7  1    D  1  1

按数字访问最右边的两列熊猫数据框

问题描述

2 个解决方案

解决方案1
2 已采纳 2020-02-17 02:08:08

解决方案2
1 2020-02-17 01:49:54

按数字访问最右边的两列熊猫数据框

问题描述

2 个解决方案

解决方案1 2 已采纳 2020-02-17 02:08:08

解决方案2 1 2020-02-17 01:49:54

解决方案1
2 已采纳 2020-02-17 02:08:08

解决方案2
1 2020-02-17 01:49:54