簡體   English   中英

Java - 基於引號和大寫情況對字符串進行標記

[英]Java - Tokenizing a string based on quotes and capital case

我想知道什么是標記字符串的好方法,例如:

"'The president' of the United States is Barack Obama"

所以它返回:

{The president, of, the, United States, is, Barack Obama}

經過一些環顧四周,我設法得到以下正則表達式:

([A-Z][a-zA-Z0-9-]*)([\s][A-Z][a-zA-Z0-9-]*)+|'([^']*?)'|[^\s{.,:;”’()?!}]+

這似乎適合我的目的。

來源: https//stackoverflow.com/a/4113082/6601606 https://stackoverflow.com/a/16746437/6601606

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM