在 python 中轉換數據幀

Question

我有以下數據集的情況：

ID      A     B    C
1      aa     -    -
2      -      bb   -
3      -      -    cc
4      aaa    -    -

應將其轉換為以下數據框：

ID    A
 1    aa
 2    bb
 3    cc
 4    aa

所以本質上是移動行，使其適合第一列

Answer 1

在將符號“-” replace為 nan 之后，您可以使用bfill和沿列的軸：

df_ = df.replace('-', np.nan).bfill(1)[['ID', 'A']]
print(df_)
  ID    A
0  1   aa
1  2   bb
2  3   cc
3  4  aaa

Answer 2

您可以使用df.replace將-替換為 np.nan 並將'ID'設置為索引，然后將df.stack和df.droplevel

df.replace('-',np.nan).set_index('ID').stack().droplevel(1)

ID
1     aa
2     bb
3     cc
4    aaa
dtype: object

Answer 3

for i in range(len(df)):
    if df.at[i, 'A'] == '-':
        if df.at[i, 'B'] == '-':
            df.at[i, 'A'] = df.at[i, 'C']
        else:
            df.at[i, 'A'] = df.at[i, 'B']

df.drop(['B', 'C'], axis=1, inplace = True)

只需使用嵌套 if 語句來查找我們在其中包含-以外的其他內容的列，並將該值分配給列A中的值。

**Output** : df

    ID  A
0   1   aa
1   2   bb
2   3   cc
3   4   aaa

Answer 4

你可以試試這個：

df.replace('-', np.nan, inplace=True)
df['new'] = df[df.columns[1:]].apply(
    lambda x: ''.join(x.dropna().astype(str)),
    axis=1
)
df = df[['ID', 'new']]
print(df)

輸出：

   ID  new
0   1   aa
1   2   bb
2   3   cc
3   4  aaa

在 python 中轉換數據幀

問題描述

4 個解決方案

解決方案1
3 已采納 2020-06-18 14:50:01

解決方案2
3 2020-06-18 14:50:10

解決方案3
1 2020-06-18 14:39:31

解決方案4
1 2020-06-18 14:46:32

在 python 中轉換數據幀

問題描述

4 個解決方案

解決方案1 3 已采納 2020-06-18 14:50:01

解決方案2 3 2020-06-18 14:50:10

解決方案3 1 2020-06-18 14:39:31

解決方案4 1 2020-06-18 14:46:32

解決方案1
3 已采納 2020-06-18 14:50:01

解決方案2
3 2020-06-18 14:50:10

解決方案3
1 2020-06-18 14:39:31

解決方案4
1 2020-06-18 14:46:32