标签[unaccent] - 堆栈内存溢出

如何取消 PySpark 中的特殊字符？ - How to unaccent special characters in PySpark?

我有一个带有特殊字符的字符串列的 spark df，例如áãâàéêèíîìóõôòúûùç ，我想分别用aaaaeeeiiioooouuuc替换它们作为我想要的一个例子：我找到了这个例子，但它不适用于这些特殊字符Pyspark 删除 dataframe 列中的多个字符我试图手动创建这个 df ...

使用 unaccent 和两个不同的规则 - Using unaccent with two different rules

德语使用变音字符 ä、ö、ü。对于国际使用，它们被翻译成ae、oe、ue（不是a、o、u）。这意味着，穆勒在他的身份证件上就是穆勒。当我们使用（例如）护照阅读器阅读文档时，这就是我们得到的，这就是我们保存到数据库表中的内容。在下一步中，我们搜索记录。我们通过两种方式做到这一点：通 ...

BigQuery UDF 删除字符串中的重音/变音符号 - BigQuery UDF to remove accents/diacritics in a string

使用此 javascript 代码，我们可以删除字符串中的重音/变音符号。如果我们创建 BigQuery UDF，则不会（即使使用双 \\）。对此有什么想法吗？ ...

Unaccent() function 替代 TEIID - Unaccent() function alternative in TEIID

我们需要在欧洲观众的应用程序中忽略重音搜索。 TEIID 是否提供此处提到的 function 的替代品？ TEIID 无法识别此 function：TEIID30068 function 'unaccent(text)' 是未知形式。检查 function 名称和 arguments 的编 ...

在 Knex.js 查询中使用非重音 postgres 扩展 - Use unaccent postgres extension in Knex.js Querys

我需要在没有识别口音（á、í、ö 等）的情况下查询 postgresdb。我已经使用 Knex.js 作为查询构建器，并且 postgresql 有一个 unaccent 扩展，可以在直接到 db 的 sql 查询中正常工作，但在我的代码中，我使用 knex 和 unaccent 函数在查询中抛 ...

检查 PostgreSQL 中的 UNIQUE 约束违规时的 UNACCENT - UNACCENT when checking for UNIQUE contraint violations in PostgreSQL

我们对表有一个UNIQUE约束，以防止我们的city_name和state_id组合被重复。我们发现的问题是口音绕过了这一点。示例： "Montréal" "Quebec"和"Montreal" "Quebec" 我们需要一种方法让唯一约束运行UNACCENT()并最好将其包装在LOWER() ...

Redshift中的Python UDF函数总是返回NULL值 - Python UDF function in Redshift always return NULL value

我想在 Redshift 中有一个功能可以从单词中删除重音符号。我在 SO( question ) 中发现了一个问题，用 Python 中的代码来制作它。我尝试了一些解决方案，其中之一是：然后我在 Redshift 中创建函数如下：我将它应用到一列：只获取空值。列城市是 va ...

在 heroku postgres 数据库上存储自定义文件 - Store custom files on heroku postgres database

我想创建的内置函数的自定义规则unaccent上的Postgres。 Postgres 的文档声明This file must be stored in $SHAREDIR/tsearch_data/ (where $SHAREDIR means the PostgreSQL installati ...

如何以编程方式重读熊猫数据帧标头 - How to programatically unaccent pandas dataframe header

我有几个 Pandas 数据框，它们的列名中有不同的重音字符。我想仅在列名中将重音字符转换为非重音字符。我正在寻找我经常在 R 中使用的类似解决方案： names(DT) = stringi::stri_trans_to_general('latin-ASCII', names(DT)) ...

PostgreSQL Levenshtein和预组合字符与组合字符 - Postgresql levenshtein and precomposed character vs. combined character

我有包含两个相似外观字符的字符串。两者都显示为带有小齿的小字母“ a”：一种一种（注意：根据渲染器的不同，有时它们的渲染方式相似，有时略有不同）但是，它们是不同的：第一个角色的特征：在PostgreSQL中：十六进制中的UTF-8编码 ...

在 Laravel Eloquent Query 中使用 unaccent PostgreSQL 函数 - Use unaccent PostgreSQL function within Laravel Eloquent Query

在尝试从数据库中检索记录时，我无法使用 pgsql 扩展 unaccent。我在我的应用程序中设置了一个动态搜索，使用 Ajax 发送用户在字段中键入的内容以及选择的字段。在将字符串发送到我的控制器之前，我用 javascript 函数替换了字符串中的每个重音符号。我的问题是我不知道如何让 ...

Amazon RDS + PostgreSQL +口音+喜欢 - Amazon RDS + PostgreSQL + accent + like

使用标题中所述的配置时遇到很多麻烦。我的问题：我在AWS RDS中有一个PostgreSQL DB 10.0 该数据库配置了UTF-8 我有一张用法语描述疾病的表格（所以有重音）我想查找描述中包含特定单词的所有代码例如，我的搜索是： SE ...

unaccent（）不能与plpgsql动态查询中的希腊字母一起使用 - unaccent() does not work with Greek letters in plpgsql dynamic query

我使用PostgreSQL 10并运行CREATE EXTENSION unaccent; 成功地。我有一个plgsql函数，其中包含以下whereText := 'lower(unaccent(place.name)) LIKE lower(unaccent($1))'; 之后，根 ...

具有不重音和pg_trgm的多列索引（匹配脏数据） - Multi-column index with unaccent and pg_trgm (matching dirty data)

我有一个包含客户数据的表，它具有12M +记录。我想基于几个字段来查询它，例如：first_name，last_name，birth_place。但是数据确实很脏，因此，我什至希望记录不完全匹配。我为此使用模块unaccent和pg_trgm。我跟着这个问题能在指数使用una ...

在tomcat中部署战争之后，Java文本规范化的行为有所不同 - Java text normalization behaving differently after deploying the war in tomcat

我正在尝试规范化带有重音字符的字符串。它可以在我的intellij IDE上正常运行，但是当我使用maven进行构建并将war部署在tomcat中时，会得到类似这样的意外结果。你能帮忙吗？ Java代码规范化 Tomcat日志的输出：当我在IDE的本地计算机上运行 ...

Postgres UNACCENT 用于具有 1 个以上变音符号的字符 - Postgres UNACCENT for character with more than 1 diacritic

UNACCENT函数可以去除字符的变音符号。但是，就我而言，它只能删除带有 1 个变音符号的字符，例如清超人啊啊啊对于超过 1 个变音符号的字符， UNACCENT什么都不做，例如蓑一种 phố 有没有办法让 Postgres 从这些字符中去除重音？谢谢 ...

Postgres字符的不重音功能 - Postgres unaccent function for character

我在Postgres中使用unaccent，但是它不能转换特殊字符，例如： ù : u&#x0300; 但是ù: &#x00F9;没关系ù: &#x00F9; 2个字符含义相同但代码不同，第一个是字符u + ̀ 我该如何解决这个问题？非常感谢。 ...

postgres unaccent 函数 vs RoR 音译 - postgres unaccent function vs RoR transliterate

在我们的 RoR 项目中，我们使用 postgres unaccent 函数来检索我们的模型名称属性之一的非重音版本。 name 属性可以包含来自各种语言的任何重音字符。然后我们将其保存为 unaccent_name 属性。我不喜欢这个解决方案，因为我们需要确保已经安装和访问 postgres ...

Postgres和unaccent扩展默认目录 - Postgres and unaccent extension default directory

我需要在postgres数据库中添加一个名为unaccent的扩展名。 Postgres版本PostgreSQL version: 9.3rc1 我在安装扩展程序时遇到问题。我做了什么：须藤apt-get install postgresql-contrib-9. ...

unaccent（）阻止Postgres中的索引使用 - unaccent() preventing index usage in Postgres

我想从导入PostgreSQL 9.3.5的OpenStreetMap数据库中检索具有给定名称的方法，操作系统是Win7 64位。为了有点容错，我使用了Postgres的unaccent扩展。我的查询如下：查询计划：奇怪的是，这个查询使用顺序扫描方式，虽然下面有一 ...