![](/img/trans.png)
[英]pandas dataframe - remove values from a group with less than X rows
[英]Removing from pandas dataframe all rows having less than 3 characters
我有這個數據框
Word Frequency
0 : 79
1 , 60
2 look 26
3 e 26
4 a 25
... ... ...
95 trump 2
96 election 2
97 step 2
98 day 2
99 university 2
我想刪除所有少於 3 個字符的單詞。 我試過如下:
df['Word']=df['Word'].str.findall('\w{3,}').str.join(' ')
但它不會從我的數據集中刪除它們。 你能告訴我如何刪除它們嗎? 我的預期輸出是:
Word Frequency
2 look 26
... ... ...
95 trump 2
96 election 2
97 step 2
98 day 2
99 university 2
試試
df = df[df['Word'].str.len()>=3]
您可以使用.str.len()
來獲取列中每個字符串的長度,而不是嘗試使用正則表達式。 然后您可以簡單地根據該長度進行過濾>= 3
應該看起來像:
df.loc[df["Word"].str.len() >= 3]
請嘗試
df[df.Word.str.len()>=3]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.