[英]Pandas Dataframe find and substring
我想基於str.find()的結果對數據框的列進行子字符串化
我發現每行字符串的起點並將其存儲在新列中
orders["test"]= orders["meta_data"].str.find("utm_source:").astype(int)
現在,我想在發現之后切出20個字符:
orders["test2"] = orders["meta_data"].str[orders["test"] : orders["test"]+20]
我想這是行不通的,因為orders [“ test”]是一個序列。 但我不知道如何從正確的行中提取該特定數字
現在我得到的是NaN值,但是預期的輸出將是20個字符的字符串。
干杯
將DataFrame.apply
與axis=1
和lambda函數一起使用來處理每行:
orders["test2"] = orders.apply(lambda x: x["meta_data"][x["test"] : x["test"]+20], axis=1)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.