[英]Add, Delete, Edit Rows and Columns while Iterating PANDAS DATAFRAME
說您有一些“文本規范化”功能:
def normalises_text(text):
....
return normalised_text
您可以將此“行向”應用於“文本”列,並將其非常簡單地放在新列中,如下所示:
df['normalised_text'] = df.text.apply(normalises_text)
要刪除不符合某些條件的行,您需要一種在數據框中定義條件的方法。
假設您定義了一個函數,該函數標識文本是否為英語,並返回一個布爾值:
def is_text_english(text):
....
return text_is_english
然后像以前一樣將其放在一列中:
df['text_is_english'] = df.text.apply(is_text_english)
然后,您可以按以下方式過濾數據框:
filtered_df = df[df.text_is_english]
或者,假設您有一列指出推文語言的列,則可以執行以下操作:
filtered_df = df[df.tweet_language == 'EN']
這里的關鍵是apply函數:
https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.apply.html
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.