cost 332 ms
如何取消 PySpark 中的特殊字符?

[英]How to unaccent special characters in PySpark?

我有一個帶有特殊字符的字符串列的 spark df,例如áãâàéêèíîìóõôòúûùç ,我想分別用aaaaeeeiiioooouuuc替換它們作為我想要的一個例子: 我找到了這個例子,但它不適用於這些特殊字符Pyspark 刪除 dataframe 列中的多個字符我試圖手動創建這個 df ...

使用 unaccent 和兩個不同的規則

[英]Using unaccent with two different rules

德語使用變音字符 ä、ö、ü。 對於國際使用,它們被翻譯成ae、oe、ue(不是a、o、u)。 這意味着,穆勒在他的身份證件上就是穆勒。 當我們使用(例如)護照閱讀器閱讀文檔時,這就是我們得到的,這就是我們保存到數據庫表中的內容。 在下一步中,我們搜索記錄。 我們通過兩種方式做到這一點: 通 ...

Unaccent() function 替代 TEIID

[英]Unaccent() function alternative in TEIID

我們需要在歐洲觀眾的應用程序中忽略重音搜索。 TEIID 是否提供此處提到的 function 的替代品? TEIID 無法識別此 function:TEIID30068 function 'unaccent(text)' 是未知形式。 檢查 function 名稱和 arguments 的編 ...

在 Knex.js 查詢中使用非重音 postgres 擴展

[英]Use unaccent postgres extension in Knex.js Querys

我需要在沒有識別口音(á、í、ö 等)的情況下查詢 postgresdb。 我已經使用 Knex.js 作為查詢構建器,並且 postgresql 有一個 unaccent 擴展,可以在直接到 db 的 sql 查詢中正常工作,但在我的代碼中,我使用 knex 和 unaccent 函數在查詢中拋 ...

檢查 PostgreSQL 中的 UNIQUE 約束違規時的 UNACCENT

[英]UNACCENT when checking for UNIQUE contraint violations in PostgreSQL

我們對表有一個UNIQUE約束,以防止我們的city_name和state_id組合被重復。 我們發現的問題是口音繞過了這一點。 示例: "Montréal" "Quebec"和"Montreal" "Quebec" 我們需要一種方法讓唯一約束運行UNACCENT()並最好將其包裝在LOWER() ...

Redshift中的Python UDF函數總是返回NULL值

[英]Python UDF function in Redshift always return NULL value

我想在 Redshift 中有一個功能可以從單詞中刪除重音符號。 我在 SO( question ) 中發現了一個問題,用 Python 中的代碼來制作它。 我嘗試了一些解決方案,其中之一是: 然后我在 Redshift 中創建函數如下: 我將它應用到一列: 只獲取空值。 列城市是 va ...

如何以編程方式重讀熊貓數據幀標頭

[英]How to programatically unaccent pandas dataframe header

我有幾個 Pandas 數據框,它們的列名中有不同的重音字符。 我想僅在列名中將重音字符轉換為非重音字符。 我正在尋找我經常在 R 中使用的類似解決方案: names(DT) = stringi::stri_trans_to_general('latin-ASCII', names(DT)) ...

PostgreSQL Levenshtein和預組合字符與組合字符

[英]Postgresql levenshtein and precomposed character vs. combined character

我有包含兩個相似外觀字符的字符串。 兩者都顯示為帶有小齒的小字母“ a”: 一種 一種 (注意:根據渲染器的不同,有時它們的渲染方式相似,有時略有不同) 但是,它們是不同的: 第一個角色的特征: 在PostgreSQL中: 十六進制中的UTF-8編碼 ...

在 Laravel Eloquent Query 中使用 unaccent PostgreSQL 函數

[英]Use unaccent PostgreSQL function within Laravel Eloquent Query

在嘗試從數據庫中檢索記錄時,我無法使用 pgsql 擴展 unaccent。 我在我的應用程序中設置了一個動態搜索,使用 Ajax 發送用戶在字段中鍵入的內容以及選擇的字段。 在將字符串發送到我的控制器之前,我用 javascript 函數替換了字符串中的每個重音符號。 我的問題是我不知道如何讓 ...

Amazon RDS + PostgreSQL +口音+喜歡

[英]Amazon RDS + PostgreSQL + accent + like

使用標題中所述的配置時遇到很多麻煩。 我的問題 : 我在AWS RDS中有一個PostgreSQL DB 10.0 該數據庫配置了UTF-8 我有一張用法語描述疾病的表格(所以有重音) 我想查找描述中包含特定單詞的所有代碼 例如,我的搜索是: SE ...

具有不重音和pg_trgm的多列索引(匹配臟數據)

[英]Multi-column index with unaccent and pg_trgm (matching dirty data)

我有一個包含客戶數據的表,它具有12M +記錄。 我想基於幾個字段來查詢它,例如:first_name,last_name,birth_place。 但是數據確實很臟,因此,我什至希望記錄不完全匹配。 我為此使用模塊unaccent和pg_trgm。 我跟着這個問題能在指數使用una ...

在tomcat中部署戰爭之后,Java文本規范化的行為有所不同

[英]Java text normalization behaving differently after deploying the war in tomcat

我正在嘗試規范化帶有重音字符的字符串。 它可以在我的intellij IDE上正常運行,但是當我使用maven進行構建並將war部署在tomcat中時,會得到類似這樣的意外結果。 你能幫忙嗎? Java代碼規范化 Tomcat日志的輸出: 當我在IDE的本地計算機上運行 ...

Postgres UNACCENT 用於具有 1 個以上變音符號的字符

[英]Postgres UNACCENT for character with more than 1 diacritic

UNACCENT函數可以去除字符的變音符號。 但是,就我而言,它只能刪除帶有 1 個變音符號的字符,例如 清 超人 啊啊啊 對於超過 1 個變音符號的字符, UNACCENT什么都不做,例如 蓑 一種 phố 有沒有辦法讓 Postgres 從這些字符中去除重音? 謝謝 ...

Postgres字符的不重音功能

[英]Postgres unaccent function for character

我在Postgres中使用unaccent,但是它不能轉換特殊字符,例如: ù : ù 但是ù: ù沒關系ù: ù 2個字符含義相同但代碼不同,第一個是字符u + ̀ 我該如何解決這個問題? 非常感謝。 ...

postgres unaccent 函數 vs RoR 音譯

[英]postgres unaccent function vs RoR transliterate

在我們的 RoR 項目中,我們使用 postgres unaccent 函數來檢索我們的模型名稱屬性之一的非重音版本。 name 屬性可以包含來自各種語言的任何重音字符。 然后我們將其保存為 unaccent_name 屬性。 我不喜歡這個解決方案,因為我們需要確保已經安裝和訪問 postgres ...

Postgres和unaccent擴展默認目錄

[英]Postgres and unaccent extension default directory

我需要在postgres數據庫中添加一個名為unaccent的擴展名。 Postgres版本PostgreSQL version: 9.3rc1 我在安裝擴展程序時遇到問題。 我做了什么: 須藤apt-get install postgresql-contrib-9. ...

unaccent()阻止Postgres中的索引使用

[英]unaccent() preventing index usage in Postgres

我想從導入PostgreSQL 9.3.5的OpenStreetMap數據庫中檢索具有給定名稱的方法,操作系統是Win7 64位。 為了有點容錯,我使用了Postgres的unaccent擴展。 我的查詢如下: 查詢計划: 奇怪的是,這個查詢使用順序掃描方式,雖然下面有一 ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM