在PHP中從非英語字符串中獲取前3個單詞

Question

我想在php中使用非英語字符串中的前三個單詞。 例如：

এখানে কিংকর্তব্যবিমূঢ় হবার কোনো সুযোগ নেই

我發現英文文本有可能：

$phrase = 'Lorem ipsum dolor sit amet, consectetur adipiscing elit';
echo implode(' ', array_slice(str_word_count($phrase, 2), 0, 3));

但它不適用於我的非英語（bengali）文本。 有人能告訴我怎么辦？

Answer 1

使用explode和內implode

1）按空間explode字符串

2）使用array_slice獲取前三個切片

3）再次用空間implode它

<?php

  $string = 'এখানে কিংকর্তব্যবিমূঢ় হবার কোনো সুযোগ নেই';
  $array = array_slice(explode(" ",$string),0,3);

  echo implode(" ",$array)."<br>";

  ?>

Answer 2

你可以使用explode ， array_slice和implode ：

$string = "এখানে কিংকর্তব্যবিমূঢ় হবার কোনো সুযোগ নেই";
$parts = explode(" ", $string);
$x = array_slice($parts, 0, 3);
print implode(" ", $x);
# এখানে কিংকর্তব্যবিমূঢ় হবার

Answer 3

你沒有提到你正在使用的PHP版本，但PHP和UTF的主要痛苦在於它有時不能一起工作，因為許多字符串操作方法主要基於假設“1 char = 1 byte”。 MBString擴展在很多情況下解決了這個問題，但並不是所有情 在您的情況下， str_word_count()需要替換為多字節感知對應物，即mb_split() ：

echo implode(' ', array_slice(mb_split("\s", $phrase), 0, 3));

Answer 4

在這里，您可以使用正則表達式的強大功能：

^(?:\b\p{Bengali}+\s*){3}

請參閱regex101.com上的演示 。

在PHP中將是：

 <?php $string = "এখানে কিংকর্তব্যবিমূঢ় হবার কোনো সুযোগ নেই"; $regex = '~^(?:\\b\\p{Bengali}+\\s*){3}~u'; if (preg_match($regex, $string, $match)) { echo $match[0]; } # এখানে কিংকর্তব্যবিমূঢ় হবার ?>

在ideone.com上觀看演示 。

在PHP中從非英語字符串中獲取前3個單詞

問題描述

4 個解決方案

解決方案1
1 已采納 2017-04-19 09:45:05

解決方案2
1 2017-04-19 09:45:56

解決方案3
1 2017-04-19 09:46:02

解決方案4
0 2017-04-19 09:53:25

在PHP中從非英語字符串中獲取前3個單詞

問題描述

4 個解決方案

解決方案1 1 已采納 2017-04-19 09:45:05

解決方案2 1 2017-04-19 09:45:56

解決方案3 1 2017-04-19 09:46:02

解決方案4 0 2017-04-19 09:53:25

解決方案1
1 已采納 2017-04-19 09:45:05

解決方案2
1 2017-04-19 09:45:56

解決方案3
1 2017-04-19 09:46:02

解決方案4
0 2017-04-19 09:53:25