熊貓數據框查找和子字符串

Question

我想基於str.find（）的結果對數據框的列進行子字符串化

我發現每行字符串的起點並將其存儲在新列中

orders["test"]= orders["meta_data"].str.find("utm_source:").astype(int)

現在，我想在發現之后切出20個字符：

orders["test2"] = orders["meta_data"].str[orders["test"] : orders["test"]+20]

我想這是行不通的，因為orders [“ test”]是一個序列。 但我不知道如何從正確的行中提取該特定數字

現在我得到的是NaN值，但是預期的輸出將是20個字符的字符串。

干杯

Answer 1

將DataFrame.apply與axis=1和lambda函數一起使用來處理每行：

orders["test2"] = orders.apply(lambda x: x["meta_data"][x["test"] : x["test"]+20], axis=1)