標簽[unaccent] - 堆棧內存溢出

[英]How to unaccent special characters in PySpark?

我有一個帶有特殊字符的字符串列的 spark df，例如áãâàéêèíîìóõôòúûùç ，我想分別用aaaaeeeiiioooouuuc替換它們作為我想要的一個例子：我找到了這個例子，但它不適用於這些特殊字符Pyspark 刪除 dataframe 列中的多個字符我試圖手動創建這個 df ...

使用 unaccent 和兩個不同的規則

[英]Using unaccent with two different rules

德語使用變音字符 ä、ö、ü。對於國際使用，它們被翻譯成ae、oe、ue（不是a、o、u）。這意味着，穆勒在他的身份證件上就是穆勒。當我們使用（例如）護照閱讀器閱讀文檔時，這就是我們得到的，這就是我們保存到數據庫表中的內容。在下一步中，我們搜索記錄。我們通過兩種方式做到這一點：通 ...

BigQuery UDF 刪除字符串中的重音/變音符號

[英]BigQuery UDF to remove accents/diacritics in a string

使用此 javascript 代碼，我們可以刪除字符串中的重音/變音符號。如果我們創建 BigQuery UDF，則不會（即使使用雙 \\）。對此有什么想法嗎？ ...

Unaccent() function 替代 TEIID

[英]Unaccent() function alternative in TEIID

我們需要在歐洲觀眾的應用程序中忽略重音搜索。 TEIID 是否提供此處提到的 function 的替代品？ TEIID 無法識別此 function：TEIID30068 function 'unaccent(text)' 是未知形式。檢查 function 名稱和 arguments 的編 ...

在 Knex.js 查詢中使用非重音 postgres 擴展

[英]Use unaccent postgres extension in Knex.js Querys

我需要在沒有識別口音（á、í、ö 等）的情況下查詢 postgresdb。我已經使用 Knex.js 作為查詢構建器，並且 postgresql 有一個 unaccent 擴展，可以在直接到 db 的 sql 查詢中正常工作，但在我的代碼中，我使用 knex 和 unaccent 函數在查詢中拋 ...

檢查 PostgreSQL 中的 UNIQUE 約束違規時的 UNACCENT

[英]UNACCENT when checking for UNIQUE contraint violations in PostgreSQL

我們對表有一個UNIQUE約束，以防止我們的city_name和state_id組合被重復。我們發現的問題是口音繞過了這一點。示例： "Montréal" "Quebec"和"Montreal" "Quebec" 我們需要一種方法讓唯一約束運行UNACCENT()並最好將其包裝在LOWER() ...

Redshift中的Python UDF函數總是返回NULL值

[英]Python UDF function in Redshift always return NULL value

我想在 Redshift 中有一個功能可以從單詞中刪除重音符號。我在 SO( question ) 中發現了一個問題，用 Python 中的代碼來制作它。我嘗試了一些解決方案，其中之一是：然后我在 Redshift 中創建函數如下：我將它應用到一列：只獲取空值。列城市是 va ...

在 heroku postgres 數據庫上存儲自定義文件

[英]Store custom files on heroku postgres database

我想創建的內置函數的自定義規則unaccent上的Postgres。 Postgres 的文檔聲明This file must be stored in $SHAREDIR/tsearch_data/ (where $SHAREDIR means the PostgreSQL installati ...

如何以編程方式重讀熊貓數據幀標頭

[英]How to programatically unaccent pandas dataframe header

我有幾個 Pandas 數據框，它們的列名中有不同的重音字符。我想僅在列名中將重音字符轉換為非重音字符。我正在尋找我經常在 R 中使用的類似解決方案： names(DT) = stringi::stri_trans_to_general('latin-ASCII', names(DT)) ...

PostgreSQL Levenshtein和預組合字符與組合字符

[英]Postgresql levenshtein and precomposed character vs. combined character

我有包含兩個相似外觀字符的字符串。兩者都顯示為帶有小齒的小字母“ a”：一種一種（注意：根據渲染器的不同，有時它們的渲染方式相似，有時略有不同）但是，它們是不同的：第一個角色的特征：在PostgreSQL中：十六進制中的UTF-8編碼 ...

在 Laravel Eloquent Query 中使用 unaccent PostgreSQL 函數

[英]Use unaccent PostgreSQL function within Laravel Eloquent Query

在嘗試從數據庫中檢索記錄時，我無法使用 pgsql 擴展 unaccent。我在我的應用程序中設置了一個動態搜索，使用 Ajax 發送用戶在字段中鍵入的內容以及選擇的字段。在將字符串發送到我的控制器之前，我用 javascript 函數替換了字符串中的每個重音符號。我的問題是我不知道如何讓 ...

Amazon RDS + PostgreSQL +口音+喜歡

[英]Amazon RDS + PostgreSQL + accent + like

使用標題中所述的配置時遇到很多麻煩。我的問題：我在AWS RDS中有一個PostgreSQL DB 10.0 該數據庫配置了UTF-8 我有一張用法語描述疾病的表格（所以有重音）我想查找描述中包含特定單詞的所有代碼例如，我的搜索是： SE ...

unaccent（）不能與plpgsql動態查詢中的希臘字母一起使用

[英]unaccent() does not work with Greek letters in plpgsql dynamic query

我使用PostgreSQL 10並運行CREATE EXTENSION unaccent; 成功地。我有一個plgsql函數，其中包含以下whereText := 'lower(unaccent(place.name)) LIKE lower(unaccent($1))'; 之后，根 ...

具有不重音和pg_trgm的多列索引（匹配臟數據）

[英]Multi-column index with unaccent and pg_trgm (matching dirty data)

我有一個包含客戶數據的表，它具有12M +記錄。我想基於幾個字段來查詢它，例如：first_name，last_name，birth_place。但是數據確實很臟，因此，我什至希望記錄不完全匹配。我為此使用模塊unaccent和pg_trgm。我跟着這個問題能在指數使用una ...

在tomcat中部署戰爭之后，Java文本規范化的行為有所不同

[英]Java text normalization behaving differently after deploying the war in tomcat

我正在嘗試規范化帶有重音字符的字符串。它可以在我的intellij IDE上正常運行，但是當我使用maven進行構建並將war部署在tomcat中時，會得到類似這樣的意外結果。你能幫忙嗎？ Java代碼規范化 Tomcat日志的輸出：當我在IDE的本地計算機上運行 ...

Postgres UNACCENT 用於具有 1 個以上變音符號的字符

[英]Postgres UNACCENT for character with more than 1 diacritic

UNACCENT函數可以去除字符的變音符號。但是，就我而言，它只能刪除帶有 1 個變音符號的字符，例如清超人啊啊啊對於超過 1 個變音符號的字符， UNACCENT什么都不做，例如蓑一種 phố 有沒有辦法讓 Postgres 從這些字符中去除重音？謝謝 ...

Postgres字符的不重音功能

[英]Postgres unaccent function for character

我在Postgres中使用unaccent，但是它不能轉換特殊字符，例如： ù : u&#x0300; 但是ù: &#x00F9;沒關系ù: &#x00F9; 2個字符含義相同但代碼不同，第一個是字符u + ̀ 我該如何解決這個問題？非常感謝。 ...

postgres unaccent 函數 vs RoR 音譯

[英]postgres unaccent function vs RoR transliterate

在我們的 RoR 項目中，我們使用 postgres unaccent 函數來檢索我們的模型名稱屬性之一的非重音版本。 name 屬性可以包含來自各種語言的任何重音字符。然后我們將其保存為 unaccent_name 屬性。我不喜歡這個解決方案，因為我們需要確保已經安裝和訪問 postgres ...

Postgres和unaccent擴展默認目錄

[英]Postgres and unaccent extension default directory

我需要在postgres數據庫中添加一個名為unaccent的擴展名。 Postgres版本PostgreSQL version: 9.3rc1 我在安裝擴展程序時遇到問題。我做了什么：須藤apt-get install postgresql-contrib-9. ...

unaccent（）阻止Postgres中的索引使用

[英]unaccent() preventing index usage in Postgres

我想從導入PostgreSQL 9.3.5的OpenStreetMap數據庫中檢索具有給定名稱的方法，操作系統是Win7 64位。為了有點容錯，我使用了Postgres的unaccent擴展。我的查詢如下：查詢計划：奇怪的是，這個查詢使用順序掃描方式，雖然下面有一 ...