減去熊貓中的一批列

Question

我正在過渡到使用熊貓來處理我的csv數據集。 我目前正在嘗試在熊貓中做我已經很容易在numpy中做的事情：從另一組中減去一組列幾次。 這實際上是逐元素矩陣減法。

僅供參考，這曾經是我為此的numpy解決方案

def subtract_baseline(data, baseline_columns, features_columns):
    """Takes in a list of baseline columns and feature columns, and subtracts the baseline values from all features"""
    assert len(features_columns)%len(baseline_columns)==0, "The number of feature columns is not divisible by baseline columns"
    num_blocks = len(features_columns)/len(baseline_columns)    
    block_size = len(baseline_columns)                         
    for i in range(num_blocks):
        #Grab each feature block and subract the baseline
        init_col = block_size*i+features_columns[0]
        final_col = init_col+block_size
        data[:, init_col:final_col] = numpy.subtract(data[:, init_col:final_col], data[:,baseline_columns])
    return data

為了更好地說明，我們可以創建以下玩具數據集：

data = [[10,11,12,13,1,10],[20,21,22,23,1,10],[30,31,32,33,1,10],[40,41,42,43,1,10],[50,51,52,53,1,10],[60,61,62,63,1,10]]
df = pd.DataFrame(data,columns=['L1P1','L1P2','L2P1','L2P2','BP1','BP2'],dtype=float)

   L1P1  L1P2  L2P1  L2P2   BP1   BP2
0  10.0  11.0  12.0  13.0   1.0  10.0
1  20.0  21.0  22.0  23.0   1.0  10.0
2  30.0  31.0  32.0  33.0   1.0  10.0
3  40.0  41.0  42.0  43.0   1.0  10.0
4  50.0  51.0  52.0  53.0   1.0  10.0
5  60.0  61.0  62.0  63.0   1.0  10.0

正確的輸出將是以下結果：獲取L1P1和L1P2中的值並減去G1P1和G1P2（又稱為基准），然后再次對L2P1，L2P2和可能存在的任何其他列進行此操作（這是我的for循環所做的原始功能）。

   L1P1  L1P2  L2P1  L2P2   BP1   BP2
0   9.0   1.0  11.0   3.0   1.0  10.0
1  19.0  11.0  21.0  13.0   1.0  10.0
2  29.0  21.0  31.0  23.0   1.0  10.0
3  39.0  31.0  41.0  33.0   1.0  10.0
4  49.0  41.0  51.0  43.0   1.0  10.0
5  59.0  51.0  61.0  53.0   1.0  10.0

請注意，數據框的標簽不應更改，理想情況下，我希望使用一種依賴於列索引而不是標簽的方法，因為實際數據塊為30列，而不是本例中的2列。 這就是我在numpy中使用原始函數的方式，參數baseline_columns和features_columns只是列索引的列表。

此后，基線列將從數據框中一起刪除，因為它們的功能已經完成。

我嘗試使用iloc僅進行了1批處理，但是得到了Nan值

df.iloc[:,[0,1]] = df.iloc[:,[0,1]] - df.iloc[:,[4,5]]

   L1P1  L1P2  L2P1  L2P2  G1P1  G1P2
0   NaN   NaN  12.0  13.0   1.0  10.0
1   NaN   NaN  22.0  23.0   1.0  10.0
2   NaN   NaN  32.0  33.0   1.0  10.0
3   NaN   NaN  42.0  43.0   1.0  10.0
4   NaN   NaN  52.0  53.0   1.0  10.0
5   NaN   NaN  62.0  63.0   1.0  10.0

Answer 1

您是否有理由要一行完成？ 即以您的目的可以用兩行代碼來做到這一點：

df.iloc[:,0] = df.iloc[:,0] - df.iloc[:,4]
df.iloc[:,1] = df.iloc[:,1] - df.iloc[:,5]

這兩行符合我的意圖。

Answer 2

在末尾添加.values ，pandas數據.values將搜索列和索引匹配以進行減法，因為該列與0,1和4,5不匹配，它將返回NaN

df.iloc[:,[0,1]]=df.iloc[:,[0,1]].values - df.iloc[:,[4,5]].values
df
Out[176]: 
   L1P1  L1P2  L2P1  L2P2  BP1   BP2
0   9.0   1.0  12.0  13.0  1.0  10.0
1  19.0  11.0  22.0  23.0  1.0  10.0
2  29.0  21.0  32.0  33.0  1.0  10.0
3  39.0  31.0  42.0  43.0  1.0  10.0
4  49.0  41.0  52.0  53.0  1.0  10.0
5  59.0  51.0  62.0  63.0  1.0  10.0

減去熊貓中的一批列

問題描述

2 個解決方案

解決方案1
0 2018-11-20 23:09:06

解決方案2
0 已采納 2018-11-20 23:23:05

減去熊貓中的一批列

問題描述

2 個解決方案

解決方案1 0 2018-11-20 23:09:06

解決方案2 0 已采納 2018-11-20 23:23:05

解決方案1
0 2018-11-20 23:09:06

解決方案2
0 已采納 2018-11-20 23:23:05