Pandas：如何正確取消 df？

Question

我有以下 dataframe df ：

  A  B  Var    Value
0 A1 B1 T1name T1
1 A2 B2 T1name T1
2 A1 B1 T2name T2
3 A2 B2 T2name T2
4 A1 B1 T1res  1
5 A2 B2 T1res  1
6 A1 B1 T2res  2
7 A2 B2 T2res  2

我現在想“減半”我的 dataframe 因為Var包含不應在同一列下 go 的變量。 我的預期結果是：

  A  B  Name   Value
0 A1 B1 T1     1
1 A2 B2 T1     1
2 A1 B1 T2     2
3 A2 B2 T2     2

我應該用什么來正確地取消旋轉？

Answer 1

然后：

df = df[~df['Var'].isin(['T1name','T2name'])]

output：

    A   B    Var Value
4  A1  B1  T1res     1
5  A2  B2  T1res     1
6  A1  B1  T2res     2
7  A2  B2  T2res     2

Answer 2

只需過濾字符串包含res的位置，並使用 var 列的前兩個字符分配一個新列

df[df['Var'].str.contains('res')].assign(Name=df['Var'].str[:2]).drop(columns='Var')

    A   B Value Name
4  A1  B1     1   T1
5  A2  B2     1   T1
6  A1  B1     2   T2
7  A2  B2     2   T2

請注意，這會創建原始 DataFrame 的切片，而不是副本

Answer 3

查看 df 有不同的選項。 正則表達式似乎位居榜首。 如果正則表達式不起作用，也許考慮重新定義您的問題：

按 dtype 過濾Value ，替換 df 中不需要的字符並重命名列。 下面的代碼

df[df['Value'].str.isnumeric()].replace(regex=r'res$', value='').rename(columns={'Var':'Name'})

    A   B Name Value
4  A1  B1   T1     1
5  A2  B2   T1     1
6  A1  B1   T2     2
7  A2  B2   T2     2

Pandas：如何正確取消 df？

問題描述

3 個解決方案

解決方案1
0 2022-01-19 16:59:40

解決方案2
0 2022-01-19 17:06:56

解決方案3
0 2022-01-19 22:15:13

Pandas：如何正確取消 df？

問題描述

3 個解決方案

解決方案1 0 2022-01-19 16:59:40

解決方案2 0 2022-01-19 17:06:56

解決方案3 0 2022-01-19 22:15:13

解決方案1
0 2022-01-19 16:59:40

解決方案2
0 2022-01-19 17:06:56

解決方案3
0 2022-01-19 22:15:13