Select 使用正则表达式匹配的字符串的特定部分

Question

请考虑下表。 我试图仅检索Tax字符串中的欧元金额。 有些记录在大小上比其他记录变化更大，但浮点数始终存在。

OrderID    SKU      Price    Tax
****       ****     ****     [<TV<standard#21.0#false#21.36#EUR>VT>]
****       ****     ****     [<TV<standard#21.0#false#7.21#EUR>VT>]
****       ****     ****     [<TV<standard#17.0#false#5.17#EUR>VT>]

我写了一个符合我需要的正则表达式： \d+\W\d+返回字符串中的两个浮点值。 在 Oracle SQL 中，我可以通过如下查询简单地获得第二次出现：

SELECT REGEXP_SUBSTR(column, '\d+\W\d+',1,2) FROM table

使用上述方法，我检索了这三个记录的21.36 、 7.21和5.17 。

如何使用 SQL 服务器实现此目的？

Answer 1

显然，正则表达式可能是这里的首选工具。 但是 SQL 服务器没有太多的原生正则表达式支持。 这是一个使用PATINDEX和CHARINDEX的纯 SQL 服务器解决方案。 这有点冗长，但可以完成工作：

SELECT
    SUBSTRING(Tax,
              CHARINDEX('#', Tax, PATINDEX('%[0-9]#%', Tax) + 3) + 1,
              CHARINDEX('#', Tax, CHARINDEX('#', Tax, PATINDEX('%[0-9]#%', Tax) + 3) + 1) -
              CHARINDEX('#', Tax, PATINDEX('%[0-9]#%', Tax) + 3) - 1)
FROM yourTable;

演示

Answer 2

请尝试以下解决方案。

该方法使用 XML 对税收列进行标记化。 它为每一行生成如下所示的 XML：

<root>
  <r>[&lt;TV&lt;standard</r>
  <r>21.0</r>
  <r>false</r>
  <r>21.36</r>
  <r>EUR&gt;VT&gt;]</r>
</root>

第 4 个 r 元素是一个有问题的 m.netary 值。

SQL

-- DDL and sample data population, start
DECLARE @tbl TABLE (ID INT IDENTITY PRIMARY KEY, Tax VARCHAR(MAX));
INSERT INTO @tbl (Tax) VALUES
('[<TV<standard#21.0#false#21.36#EUR>VT>]'),
('[<TV<standard#21.0#false#7.21#EUR>VT>]'),
('[<TV<standard#17.0#false#5.17#EUR>VT>]');
-- DDL and sample data population, end

DECLARE @separator CHAR(1) = '#';

SELECT t.*
    , c.value('(/root/r[4]/text())[1]', 'DECIMAL(10,2)') AS result
FROM @tbl AS t
CROSS APPLY (SELECT TRY_CAST('<root><r><![CDATA[' + 
        REPLACE(tax, @separator, ']]></r><r><![CDATA[') + 
        ']]></r></root>' AS XML)) AS t1(c);

Output

+----+-----------------------------------------+--------+
| ID |                   Tax                   | result |
+----+-----------------------------------------+--------+
|  1 | [<TV<standard#21.0#false#21.36#EUR>VT>] |  21.36 |
|  2 | [<TV<standard#21.0#false#7.21#EUR>VT>]  |   7.21 |
|  3 | [<TV<standard#17.0#false#5.17#EUR>VT>]  |   5.17 |
+----+-----------------------------------------+--------+

Select 使用正则表达式匹配的字符串的特定部分

问题描述

2 个解决方案

解决方案1
3 已采纳 2021-10-11 15:04:26

演示

解决方案2
0 2021-10-11 15:14:32

Select 使用正则表达式匹配的字符串的特定部分

问题描述

2 个解决方案

解决方案1 3 已采纳 2021-10-11 15:04:26

演示

解决方案2 0 2021-10-11 15:14:32

解决方案1
3 已采纳 2021-10-11 15:04:26

解决方案2
0 2021-10-11 15:14:32