更改Pandas MultiIndex DataFrame中的特定列值

Question

考虑我们有以下数据帧

myDF = DataFrame(np.random.randn(4,2), index= [[1,1,2,2],['Mon','Tue','Mon','Tue']])
myDF

             0           1
1   Mon -0.910930    1.592856
    Tue -0.167228   -0.763317
2   Mon -0.926121   -0.718729
    Tue  0.372288   -0.417337

如果我想要更改索引1中所有行的第一列的值，我尝试这样做：

myDF.ix[1,:][0] = 99

但这不起作用，并返回相同的DataFrame不变。 我错过了什么 谢谢

Answer 1

当您尝试这样的事情时，最新版本的熊猫会发出警告。 例如，在版本0.13.1上，你会得到这个：

In [4]: myDF.ix[1,:][0] = 99
SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_index,col_indexer] = value instead

你所做的是被称为链式分配，并且由于大熊猫所依赖的numpy内部运作的微妙之处而失败。

由于您有MultiIndex，因此您的情况比一般警告所解决的情况更复杂。 要选择外层中标签为1且列标签为0所有行，请使用.loc[1, 0] 。 （另见这个答案。）

In [5]: myDF.loc[1, 0] = 99

In [6]: myDF
Out[6]: 
           0         1
1 Mon  99.000000  1.609539
  Tue  99.000000  1.464771
2 Mon  -0.819186 -1.122967
  Tue  -0.545171  0.475277

Answer 2

我相信通过使用以下方法我们可以拥有真正的灵活性：

index = [idx for idx, vals in enumerate(myDF.index.values) if vals[1] in ['Mon','Wed'] and vals[0] in [2,3,4]]
colums = [0,1]
myDF.iloc[index, columns] = 99

从for循环创建索引不是最有效的方法，因此可以创建一个字典，其中键是multiIndex元组，值是索引。

这样我们就可以指定我们想要改变的两个索引级别中的哪些值。 .xs（）执行类似的操作，但您无法通过该函数更改值。

如果有一个更简单的方法，我真的很想找到它..

更改Pandas MultiIndex DataFrame中的特定列值

问题描述

2 个解决方案

解决方案1
3 2014-05-02 01:17:02

解决方案2
0 2014-05-02 02:36:15

更改Pandas MultiIndex DataFrame中的特定列值

问题描述

2 个解决方案

解决方案1 3 2014-05-02 01:17:02

解决方案2 0 2014-05-02 02:36:15

解决方案1
3 2014-05-02 01:17:02

解决方案2
0 2014-05-02 02:36:15