簡體   English   中英

如何處理正則表達式中的復合詞

[英]how to deal with compound words in regex

我正在制作從文本中返回縮寫定義的正則表達式。 我已經解決了許多情況,但我無法解決縮寫與實際單詞的字符數不同的情況,這可能是因為一個單詞像下面這樣復合。

string = 'CRC comes from the words colorectal cancer'

我想根據其簡短形式獲得“結腸直腸癌”。 你對我應該采取什么步驟有什么建議嗎? 我想過拆分復合詞,但這會導致其他問題。

在 CRC 中,第一個單詞應以 C 開頭。 and the next word could be either R or C, if second word is R, third word should be C or there is not a third word at all. 同時您應該檢查以 C 開頭的第二個單詞。 如果是這樣,您不需要檢查第三個單詞。 正則表達式中的 OR 條件可能會有所幫助。 如果我沒有足夠的數據樣本,我無法確定如何

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM