![](/img/trans.png)
[英]Remove everything except image tag from string using regular expression
[英]PHP - Regular expression to remove everything else but dates from a string
我正在从我的数据库中提取一些数据以在.csv
文件中输出。 这些输出的行可能包含也可能不包含多种不同格式的两个日期,包括:
YYYY-MM-DD (2019-02-01)
DD.MM.YYYY (01.02.2019)
D.M.YYYY (1.2.2019)
DD.MM.YY (01.02.19)
D.MM.YY (1.02.19)
D.MM.YYYY (1.02.2019)
这两个日期通常位于字符串的末尾,但很少有日期位于字符串中间的情况。 以下是从数据库输出的一些示例行:
Product 1, 1.10.2018 - 31.12.2018 just a test string
Product 2 15.12.18-23.6.19
如果从字符串中找到,我现在想做的是将这两个日期解析为一种格式(DD.MM.YYYY)到自己的变量中。
如果在字符串中找不到日期,则可以暂时忽略该行。 这是我迄今为止尝试过的:
<?php
function contains_date($str) {
if (preg_match('/\b(\d{4})-(\d{2})-(\d{2})\b/', $str, $matches)) {
if (checkdate($matches[2], $matches[3], $matches[1])) {
return true;
}
}
return false;
}
$i = 0;
$table = [];
while($row = $stmt->fetch()) {
if(contains_date($row['product'])) {
$product = preg_replace('/\s+/', '', $row['product']);
$date = substr($product, -21);
$periodStart = date('d.m.Y', strtotime(substr($date, 0, 10)));
$periodEnd = date('d.m.Y', strtotime(substr($date, 11)));
}
$table[$i]['product'] = $row['product'];
$table[$i]['startDate'] = $periodStart;
$table[$i]['endDate'] = $periodEnd;
$i++;
}
?>
这适用于日期为 YYYY-MM-DD 格式以及在字符串末尾找到两个日期的情况。 它不涵盖日期格式不同的所有情况,也不涵盖日期位于字符串中间的所有情况。 任何帮助将非常感激!
您可以使用同名组将不同的日期格式与一个正则表达式匹配:
$rx = '/(?J)(?<!\d)(?:(?<year>\d{4})-(?<month>\d{1,2})-(?<day>\d{1,2})|(?<day>\d{1,2})\.(?<month>\d{1,2})\.(?<year>\d{2}(?:\d{2})?))(?!\d)/';
请参阅正则表达式演示。
兴趣点:
J
修饰符启用一种模式中具有相同名称的组(?<!\\d)
正则表达式开头的负向后视在一个数字之后取消匹配(它匹配没有紧跟数字前面的位置)(?!\\d)
正则表达式末尾的负前瞻在数字之前取消匹配(它匹配没有紧跟数字的位置)$strs = ['YYYY-MM-DD (2019-02-01)', 'DD.MM.YYYY (01.02.2019)', 'D.M.YYYY (1.2.2019)','DD.MM.YY (01.02.19)','D.MM.YY (1.02.19)','D.MM.YYYY (1.02.2019)','Product 1, 1.10.2018 - 31.12.2018 just a test string','Product 2 15.12.18-23.6.19' ];
$rx = '/(?J)(?<!\d)(?:(?<year>\d{4})-(?<month>\d{1,2})-(?<day>\d{1,2})|(?<day>\d{1,2})\.(?<month>\d{1,2})\.(?<year>\d{2}(?:\d{2})?))(?!\d)/';
foreach ($strs as $s) {
echo "INPUT: $s\n";
if (preg_match_all($rx, $s, $matches, PREG_SET_ORDER, 0)) {
foreach ($matches as $m) {
echo "DAY: " . $m["day"] . "\nMONTH: " . $m["month"] . "\nYEAR: " . $m["year"] . "\n\n";
}
}
}
输出:
INPUT: YYYY-MM-DD (2019-02-01)
DAY: 01
MONTH: 02
YEAR: 2019
INPUT: DD.MM.YYYY (01.02.2019)
DAY: 01
MONTH: 02
YEAR: 2019
INPUT: D.M.YYYY (1.2.2019)
DAY: 1
MONTH: 2
YEAR: 2019
INPUT: DD.MM.YY (01.02.19)
DAY: 01
MONTH: 02
YEAR: 19
INPUT: D.MM.YY (1.02.19)
DAY: 1
MONTH: 02
YEAR: 19
INPUT: D.MM.YYYY (1.02.2019)
DAY: 1
MONTH: 02
YEAR: 2019
INPUT: Product 1, 1.10.2018 - 31.12.2018 just a test string
DAY: 1
MONTH: 10
YEAR: 2018
DAY: 31
MONTH: 12
YEAR: 2018
INPUT: Product 2 15.12.18-23.6.19
DAY: 15
MONTH: 12
YEAR: 18
DAY: 23
MONTH: 6
YEAR: 19
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.