簡體   English   中英

如何在 Python 中刪除字符串開頭或結尾的停用詞?

[英]How to remove stopwords at the beginning or the end of a string in Python?

使用 NLTK 工作,我正在制作一個我想到的項目的原型。 我來自 PHP,所以 Python 對我來說有點陌生。

我有一個停用列表和一個n 字字符串,n 介於 1 和 4 之間。

我想通過修剪任何停用詞的兩端來清理該字符串。 如果我在刪除一個停用詞后需要重新測試該字符串,因為在它之后可能還有另一個。

在 Python 中,您將如何在性能方面做到這一點?

將字符串標記為單詞。

使用快速的集合成員運算符來消除與停用詞列表匹配的前導/尾隨標記。

如果下一步確實需要一個字符串,則將單詞列表與慣用的' '.join(your_list)連接成一個

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM