[英]Java - Tokenizing a string based on quotes and capital case
我想知道什么是標記字符串的好方法,例如:
"'The president' of the United States is Barack Obama"
所以它返回:
{The president, of, the, United States, is, Barack Obama}
經過一些環顧四周,我設法得到以下正則表達式:
([A-Z][a-zA-Z0-9-]*)([\s][A-Z][a-zA-Z0-9-]*)+|'([^']*?)'|[^\s{.,:;”’()?!}]+
這似乎適合我的目的。
來源: https : //stackoverflow.com/a/4113082/6601606 https://stackoverflow.com/a/16746437/6601606
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.