繁体   English   中英

计算 PostgreSQL 中字符串中子字符串的出现次数

[英]Counting the number of occurrences of a substring within a string in PostgreSQL

如何计算 PostgreSQL 中字符串中子字符串的出现次数?


例子:

我有一张桌子

CREATE TABLE test."user"
(
  uid integer NOT NULL,
  name text,
  result integer,
  CONSTRAINT pkey PRIMARY KEY (uid)
)

我想写一个查询,以便result包含列怎样子的许多事件oname包含的内容。 例如,如果在一行中, namehello world ,则列result应包含2 ,因为字符串hello world有两个o

换句话说,我正在尝试编写一个作为输入的查询:

在此处输入图片说明

并更新result列:

在此处输入图片说明


我知道函数regexp_matches及其g选项,这表明需要扫描完整的( g = global)字符串以查找所有出现的子字符串)。

例子:

SELECT * FROM regexp_matches('hello world', 'o', 'g');

回报

{o}
{o}

SELECT COUNT(*)  FROM regexp_matches('hello world', 'o', 'g');

回报

2

但是我不知道如何编写一个UPDATE查询来更新result列,以便它包含列name包含的子字符串的出现次数。

一个常见的解决方案是基于这样的逻辑: 用空字符串替换搜索字符串,并将新旧长度之间的差异除以搜索字符串的长度

(CHAR_LENGTH(name) - CHAR_LENGTH(REPLACE(name, 'substring', ''))) 
/ CHAR_LENGTH('substring')

因此:

UPDATE test."user"
SET result = 
    (CHAR_LENGTH(name) - CHAR_LENGTH(REPLACE(name, 'o', ''))) 
    / CHAR_LENGTH('o');

Postgres的做法是将字符串转换为数组并计算数组的长度(然后减去1):

select array_length(string_to_array(name, 'o'), 1) - 1

请注意,这也适用于较长的子串。

因此:

update test."user"
    set result = array_length(string_to_array(name, 'o'), 1) - 1;

返回字符数,

 SELECT (LENGTH('1.1.1.1') - LENGTH(REPLACE('1.1.1.1','.',''))) AS count
--RETURN COUNT OF CHARACTER '.'

另一种方式:

UPDATE test."user" SET result = length(regexp_replace(name, '[^o]', '', 'g'));
Occcurence_Count = LENGTH(REPLACE(string_to_search,string_to_find,'~'))-LENGTH(REPLACE(string_to_search,string_to_find,''))

这个解决方案比我见过的许多解决方案更清晰,特别是没有除数。 您可以将其转换为函数或在Select中使用。
无需变量。 我使用tilde作为替换字符,但任何不在数据集中的字符都可以使用。

SELECT array_length(string_to_array('a long name here', 'o'),1)
  • 1 是一维数组
  • 'o' 是您要计算的出现次数

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM