在某個最后一個字符之前提取字符串

Question

我有以下熊貓數據框：

我想創建一個新列，該列將保存最后一個“_”字符之前的“名稱”列中的字符串，並將其從原始列中刪除。

所以所需的輸出將是：

有任何想法嗎？

Answer 1

您可以使用右拆分（ rsplit ）：

df[['Name_2', 'Name']] = df['Name'].str.rsplit('_', 1, expand=True)

帶有正則表達式的變體：

df[['Name_2', 'Name']] = df['Name'].str.extract(r'(.*)_([^_]+)$')

輸出：

  Name  ID       Name_2
0    A   1           AT
1    B   2           AT
2    F   3      AOS_PAR
3    B   4  AOS_ROOT_LE