[英]How to using `regexp` to remove all the character not in chinese and english
有ori_string ,如何用正則regexp去掉所有非中英文的字符? 謝謝! 希望的結果是 ...
[英]How to handle "Regular expression backtrack stack overflow. (U_REGEX_STACK_OVERFLOW)"?
我有一段文本,我想從中提取前兩段。 文本由幾個由空行分隔的段落組成。 段落本身可以包含換行符。 我要提取的是從文本開頭到第二個空行的所有內容。 這是原文: 我想要的文字是: 我試圖創建一個正則表達式來完成這項工作,但我認為以下似乎是一個可能的解決方案: 當我在 stri_extract_all_r ...
[英]How to remove repeated sentences with stringi?
我有一個character向量。 對於這些元素中的每一個,我 100% 肯定文本的開頭總是有重復。 重復句子的簡化示例: Hello. Hello. How are you? 等待我的目標只是Hello. How are you? Hello. How are you? 另一個例子: Hello ...
[英]R how to match regex "_a (b)"
我對這個問題很瘋狂。 在R語言正則表達式中,如何匹配一個模式“_a(b)”? a和b都代表一個詞,(. 我認為關於模式“_drop (words)”的正則表達式需要一些工作。 ...
[英]Fail to install older version of stringi using renv
我一直在嘗試使用 renv 安裝舊版本的 stringi,但出現以下錯誤。 我在使用恢復時遇到了一些早期錯誤,但幾次重新啟動已經能夠解決問題。 我嘗試刪除並重新安裝 stringi,但在嘗試加載適當的版本時仍然遇到相同的錯誤。 當我嘗試使用 devtools 直接加載版本時,它與 renv 沖突 ...
[英]How to remove hidden line breaks in character content?
我有這樣一段文字: 如果我執行此操作,我會收到錯誤消息,因為我在how之后按了 Enter。 如何刪除隱藏的換行符以便在文本上執行我的代碼? ...
[英]how to extract specific character using str_extrac() in R
語境我有一個字符向量a 。 我想使用str_extract() function 提取最后一個斜杠( / )和.nc之間的文本。 我試過這樣: str_extract(a, "(?=/).*(?=.nc)") ,但失敗了。 問題如何獲取字符向量a中最后一個 lash 和.nc之間的文本。 可重現的代 ...
[英]This keeps happening in R every time I try to load packages
所以,我不斷收到這個錯誤: library(tidyverse) Warning: package 'tidyverse' was built under R version 4.1.3 Error: package or namespace load failed for 'tidyverse' ...
[英]Using R, how does strsplit work on fixed elements with the splitter at the end of the string to split?
我正在研究一個語言解析器,我想在一個更大的字符串中計算某些字符串元素(比如"</i>" )。 由於字符串已被清理( str.trim ),它后面沒有任何內容。 我在strsplit上遇到了一些奇怪的行為,因為如果分隔符sep (在 RTM 中稱為split )位於字符串的開頭或結尾,它 ...
[英]Same regex behaves differently on grepl versus stri_detect_regex
編輯我在 R 版本 3.6.1 上遇到這個問題,顯然在較新的版本中這個問題不存在並且功能確實表現相似。 考慮這個向量,其中第一個元素在 Latin-1 Supplement unicode 塊中,第二個元素在 Latin Extended Additional unicode 塊中,元素 3-7 在 ...
[英]How to get str_sub to accept output from str_locate_all when there are multiple replacements in a string and also assign replacements, vectorized
有很多字符串替換問題,但我找不到專門解決這個問題的問題。 我有一個太長和太慢的 if else for 循環來解決這個問題,但是根據 str_sub文檔,str_locate_all 的矩陣 output 應該以矩陣形式干凈地傳遞給 str_sub 一次。 當一個字符串的模式出現不止一次時,我想傳 ...
[英]Is stringi still a dependency for tidyverse
當我從 CRAN 安裝包tidyverse時,加載包依賴stringi需要很長時間(公平地說是 8 分鍾 20 秒)。 這個問題似乎有據可查。 但是,如果我正確閱讀了這個tidyverse github 問題,看起來這個 stringi 依賴項已被刪除。 我讀對了嗎? ...
[英]Update the last occurrence of a word in a string only if certain condition is TRUE in R Programming
我有一個包含兩個字符列的數據框,我想在其中進行以下更改 library(stringr) Airport_ID <- c("3001","3002","3003","3004") Airport_Name <- c("Adelaide Airport DTS", "Brisbane ...
[英]Select and extract different capture groups from string using regex
我想使用正則表達式模式和捕獲組來提取字符串的各個部分。 我可以使用str_match_all過濾字符串,但我希望有可能明確選擇正則表達式中定義的捕獲組之一。 問題是在 data.table 內部使用它不會產生預期的結果。 我可以使用以下命令提取各種定義的捕獲組: 但是,當訪問結果列表並在da ...
[英]Installing stringi repeatedly fails
我正在嘗試安裝 likert,這需要 stringi。 install.package("likert")安裝 stringi 失敗。 來自 CRAN 的install.package("stringi")也失敗了: 我從 https 下載了 package ://cran.r-project.o ...
[英]Unable to install stringi R package on MacOS M1 Monterey
我無法使用新的 M1 和 arm64 架構在我的 Macbook Pro(運行 MacOS Monterey)上安裝 R 包stringi 。 SO上有很多帖子描述了類似的問題,但是我收到的錯誤消息是我以前從未見過的。 當我在 RStudio 中運行install.packages("strin ...
[英]How to remove repeated sequences of symbols (characters) in stringr/stringi?
我有這樣的文字: Insanely good Insanely good music. Kanye West is GOAT. The sky is blue. 我想要一個函數,無論字符串的第一個序列是什么,如果重復,就將其刪除。 在上述情況下,它將被變異為: Insanely good m ...
[英]how do I insert a character into a string at a specific location but only counting letters in R
我正在嘗試創建一個 df,在其中我將一個字符添加到由另一列定義的 position 處的字符串中 - 但我只希望代碼在執行此操作時計算字母而不是數字或其他字符,希望示例表使這一點更清楚我的初始數據看起來像這樣。 細繩插入位置多肽 3個 PE[+10]潮汐 3個我使用以下代碼 它只起作用了一半——我只 ...
[英]stringi R ignore accents special characters to match
我有兩個數據框列,一個包含帶重音的名稱,另一個不包含。 我想匹配它們,但只執行完全匹配。 例如: 看到只有“example”和“example2”保存在df中。 我嘗試使用以下解決方案,但考慮到我的數據集的大小,它的效率非常低。 ...