熊猫如何重塑包含重复列值的数据框

Question

这是我的数据框：

       chr  value   region
      chr22     1   21-77
       chr6     3   12-65
       chr3     5   73-81
       chr3     8   91-96

这就是我需要的：

                       21-77    12-65   73-81   91-96
           chr22        1       0       0       0                           
           chr6         0       3       0       0
           chr3         0       0       5       8

请注意 ，初始数据帧的第一列包含重复值。 （例如chr3）

你能告诉我如何做到这一点。 提前致谢。

Answer 1

看起来像是pandasivot_table的完美应用。

值得强调的是，pivot_table使用numpy均值作为聚合函数（如果存在多个具有相同索引和列的观察值，因此默认情况下隐式要求数字（int / floats）作为值）。

让frame为包含数据的pandas数据frame ：

import pandas as pd

cc = ['chr', 'value', 'region']
vals = [['chr22', 1, '21-77'],
       ['chr6',     3,   '12-65'],
       ['chr3',     5,   '73-81'],
       ['chr3',     8,   '91-96']]

frame = pd.DataFrame(vals, columns = cc)

result = pd.pivot_table(frame,
                        values = 'value', index = ['chr'], columns = ['region'],
                        fill_value = 0)

Answer 2

此链接有帮助吗？

为了将来参考，请在发布问题之前进行研究，因为可能已经有可以帮助您的答案，或者也许已经有人解决了您遇到的相同问题。

熊猫如何重塑包含重复列值的数据框

问题描述

2 个解决方案

解决方案1
1 已采纳 2017-04-04 16:01:19

解决方案2
0 2017-04-04 15:35:44

熊猫如何重塑包含重复列值的数据框

问题描述

2 个解决方案

解决方案1 1 已采纳 2017-04-04 16:01:19

解决方案2 0 2017-04-04 15:35:44

解决方案1
1 已采纳 2017-04-04 16:01:19

解决方案2
0 2017-04-04 15:35:44