簡體   English   中英

使用RegEx從句子中的每個單詞中刪除POS(詞性)標簽

[英]Remove POS (part-of-speech) tag from every words in sentence with RegEx

我有以下字符串,其中每個單詞都有POS( 詞性 )標簽:

The/DT suburb/NN of/IN Saffron/NNP Park/NNP lay/VBD on/IN the/DT sunset/JJ side/NN of/IN London/NNP ,/, as/IN red/JJ and/CC ragged/VBD as/IN a/DT cloud/NN of/IN sunset/NN ./. 

如何使用C#代碼中的RegEx一次刪除每個POS標簽(即/DT/NN/IN ,..., /. )?

\/[A-Z.,]*

試試這個。用empty string替換。請參閱演示。

https://regex101.com/r/sJ9gM7/109

我想“一次”是指使用一次對Regex.Replace調用。 您可以使用以下正則表達式安全刪除它們:

/(?:[.,]|\p{Lu}+\b)

在C#正則表達式中,您不必轉義/

如果要刪除/后的所有標點符號,可以使用:

/(?:\p{P}|\p{Lu}+\b)

您需要使用string.Empty作為替換字符串。

var input = "The/DT suburb/NN of/IN Saffron/NNP Park/NNP lay/VBD on/IN the/DT sunset/JJ side/NN of/IN London/NNP ,/, as/IN red/JJ and/CC ragged/VBD as/IN a/DT cloud/NN of/IN sunset/NN ./.";
var rgxx = new Regex(@"/(?:[.,]|\p{Lu}+\b)");
var result = rgxx.Replace(input, string.Empty);

輸出:

在此處輸入圖片說明

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM