繁体   English   中英

除冠词、连词和介词外,每个单词的首字母大写

[英]Capitalize first letter of each word with exception of articles, conjunctions, and prepositions

我正在为使用 Codeigniter 构建的自定义 CMS 编写标签系统,并且我正在尝试强制执行特定格式。

基本上,我需要每个单词的第一个字母大写,但以下应该是小写的除外:

  • 文章:一个,一个,该
  • 并列连词:and、but、or、for、nor等。
  • 介词(少于五个字母):with、on、at、to、from、by 等。

此外,如果标签以上述之一开头,则应大写。

一些格式正确的标签示例:

  • 权力的游戏
  • 老鼠和男人
  • 从头到尾
  • 指环王
  • 极品飞车

到目前为止,我只有:

$tag = 'Lord of the Rings';
$tag = ucwords($tag); 

$patterns = array('/A/', '/An/', '/The/', '/And/', '/Of/', '/But/', '/Or/', '/For/', '/Nor/', '/With/', '/On/', '/At/', '/To/', '/From/', '/By/' );
$lowercase = array('a', 'an', 'the', 'and', 'of', 'but', 'or', 'for', 'nor', 'with', 'on', 'at', 'to', 'from', 'by' );

$formatted_tag = preg_replace($patterns, $lowercase, $tag);

// capitalize first letter of string
$formatted_tag = ucfirst($formatted_tag);

echo $formatted_tag;

这会产生指环王的正确结果,但如何避免重复数组? 当我添加新词时,将它们匹配起来很乏味。

我确定应该包含一些我遗漏的词,是否有任何现有的函数或类可以使用?

如果您使用带有preg_replace_callback()的自定义回调,则不需要$lowercase数组。 此外,您当前的方法需要单词边界,否则它将用android替换Android或用band替换bAnd 最后,为 N 个单词创建 N 个正则表达式是低效且没有必要的,因为这可以通过一个正则表达式来完成。

我只会保留一个 words 数组:

$words = array('A', 'An', 'The', 'And', 'Of', 'But', 'Or', 'For', 'Nor', 'With', 'On', 'At', 'To', 'From', 'By' );

并创建一个动态正则表达式,完成单词边界,如下所示:

$regex = '/\b(' . implode( '|', $words) . ')\b/i';

现在用小写字母替换所有匹配项:

$formatted_tag = preg_replace_callback( $regex, function( $matches) {
    return strtolower( $matches[1]);
}, $tag);

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM