如何將特定定位的文本放入數據框索引中？

Question

我有一個帶有一些文本索引的數據框，其中包含我想復制到列表中的必要信息。

我不知道文本信息具體如何（這個詞總是改變），但我知道位於索引中的位置：

'point.subclass.optimum。 R31 .done' 。 R31 是我想寫在列表中的值，所以我知道那個總是不同的文本位於point.subclase.optimum之間。 和.done 。

我試過：

info_list = []
for col in df.columns:
    if ('point.subclase.optimum.' in col) and ('.done' in col):
        info_list.append(col)

但是該腳本只是為我提供了列表中的整個索引。

有誰知道如何解決它？

Answer 1

使用帶有轉義\\. Series.str.extract \\. 因為特殊的正則表達式字符，如果Series.dropna不匹配，則刪除可能的缺失值，最后將輸出轉換為列表：

df = pd.DataFrame({'a':range(3)}, index=['point.subclase.optimum.R31.done',
                                         'point.subclase',
                                         'point.subclase.optimum.R98.done'])
print (df)
                                 a
point.subclase.optimum.R31.done  0
point.subclase                   1
point.subclase.optimum.R98.done  2

L = (df.index.str.extract(r'point\.subclase\.optimum\.(.*)\.done', expand=False)
             .dropna()
             .tolist())
print (L)
['R31', 'R98']

如何將特定定位的文本放入數據框索引中？

問題描述

1 個解決方案

解決方案1
1 已采納 2020-03-01 14:00:26

如何將特定定位的文本放入數據框索引中？

問題描述

1 個解決方案

解決方案1 1 已采納 2020-03-01 14:00:26

解決方案1
1 已采納 2020-03-01 14:00:26