簡體   English   中英

熊貓數據框查找和子字符串

[英]Pandas Dataframe find and substring

我想基於str.find()的結果對數據框的列進行子字符串化

我發現每行字符串的起點並將其存儲在新列中

orders["test"]= orders["meta_data"].str.find("utm_source:").astype(int)

現在,我想在發現之后切出20個字符:

orders["test2"] = orders["meta_data"].str[orders["test"] : orders["test"]+20]

我想這是行不通的,因為orders [“ test”]是一個序列。 但我不知道如何從正確的行中提取該特定數字

現在我得到的是NaN值,但是預期的輸出將是20個字符的字符串。

干杯

DataFrame.applyaxis=1和lambda函數一起使用來處理每行:

orders["test2"] = orders.apply(lambda x: x["meta_data"][x["test"] : x["test"]+20], axis=1)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM