[英]Remove POS (part-of-speech) tag from every words in sentence with RegEx
我有以下字符串,其中每個單詞都有POS( 詞性 )標簽:
The/DT suburb/NN of/IN Saffron/NNP Park/NNP lay/VBD on/IN the/DT sunset/JJ side/NN of/IN London/NNP ,/, as/IN red/JJ and/CC ragged/VBD as/IN a/DT cloud/NN of/IN sunset/NN ./.
如何使用C#代碼中的RegEx一次刪除每個POS標簽(即/DT
, /NN
, /IN
,..., /.
)?
我想“一次”是指使用一次對Regex.Replace
調用。 您可以使用以下正則表達式安全刪除它們:
/(?:[.,]|\p{Lu}+\b)
在C#正則表達式中,您不必轉義/
。
如果要刪除/
后的所有標點符號,可以使用:
/(?:\p{P}|\p{Lu}+\b)
您需要使用string.Empty
作為替換字符串。
var input = "The/DT suburb/NN of/IN Saffron/NNP Park/NNP lay/VBD on/IN the/DT sunset/JJ side/NN of/IN London/NNP ,/, as/IN red/JJ and/CC ragged/VBD as/IN a/DT cloud/NN of/IN sunset/NN ./.";
var rgxx = new Regex(@"/(?:[.,]|\p{Lu}+\b)");
var result = rgxx.Replace(input, string.Empty);
輸出:
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.