[英]how to deal with compound words in regex
我正在制作從文本中返回縮寫定義的正則表達式。 我已經解決了許多情況,但我無法解決縮寫與實際單詞的字符數不同的情況,這可能是因為一個單詞像下面這樣復合。
string = 'CRC comes from the words colorectal cancer'
我想根據其簡短形式獲得“結腸直腸癌”。 你對我應該采取什么步驟有什么建議嗎? 我想過拆分復合詞,但這會導致其他問題。
在 CRC 中,第一個單詞應以 C 開頭。 and the next word could be either R or C, if second word is R, third word should be C or there is not a third word at all. 同時您應該檢查以 C 開頭的第二個單詞。 如果是這樣,您不需要檢查第三個單詞。 正則表達式中的 OR 條件可能會有所幫助。 如果我沒有足夠的數據樣本,我無法確定如何
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.