簡體   English   中英

從熊貓數據框中刪除所有少於 3 個字符的行

[英]Removing from pandas dataframe all rows having less than 3 characters

我有這個數據框

Word    Frequency
0   :       79
1   ,       60
2   look    26
3   e       26
4   a       25
... ... ...
95  trump    2
96  election 2
97  step     2
98  day      2
99  university  2

我想刪除所有少於 3 個字符的單詞。 我試過如下:

df['Word']=df['Word'].str.findall('\w{3,}').str.join(' ')

但它不會從我的數據集中刪除它們。 你能告訴我如何刪除它們嗎? 我的預期輸出是:

Word    Frequency

2   look    26

... ... ...
95  trump    2
96  election 2
97  step     2
98  day      2
99  university  2

試試

df = df[df['Word'].str.len()>=3]

您可以使用.str.len()來獲取列中每個字符串的長度,而不是嘗試使用正則表達式。 然后您可以簡單地根據該長度進行過濾>= 3

應該看起來像:

df.loc[df["Word"].str.len() >= 3]

請嘗試

 df[df.Word.str.len()>=3]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM