簡體   English   中英

pandas dataframe 列中不需要的字符

[英]unwanted characters in pandas dataframe column

我想從 dataframe 的 jobDescription 列中刪除“\n”和“[”字符。 我試試這段代碼。 但它不起作用data['jobDescription'] = data['jobDescription'].str.replace(r'\n',' ', regex=True)

您可以在下圖中看到 df; 在此處輸入圖像描述

我該如何解決這個問題? 謝謝。

您可以使用 python 正則表達式。

import re

data.jobDescription.apply(lambda x : '.join(re.findall("[a-zA-Z0-9 ]",text)))

正則表達式模式只允許字母和數字,如果你想包含符號,你可以添加模式來實現這一點。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM