根據另一個數據列中的值刪除字符串的一部分

Question

我有一個學校的數據集，我想刪除學校前面的前綴，所以它只有學校名稱（有時是數字）。 該前綴也在另一列（tipo.organización）中列出，因此我想從tipo.organización中獲取值並將其從學校名稱中刪除（nombre.establecimiento）。

我嘗試使用gsub從名稱中刪除字符串的一部分，但是我不能只是將列名作為一組要更改的值來傳遞。 我如何才能遍歷每個值並將其與tipo.organizacion列進行比較，然后刪除不需要的內容？

data <- read.csv("...", header = TRUE)
data$nombre.establecimiento <- 
as.character(data$nombre.establecimiento)

#Remove Duplicates
new <- data[!duplicated(data$nombre.establecimiento),]

#tried to take out values from other column
new$nombre.establecimiento <- gsub(new$tipo.organización, '', 
new$nombre.establecimiento)

謝謝！！

鏈接到數據集

Answer 1

這個問題有一個類似的問題，並且有很多好的答案。 在您的情況下，更stringr方法如下所示：

new$nombre.establecimiento = str_replace_all(new$nombre.establecimiento,
                                             new$tipo.organización, '')

（我遵循了鏈接並獲得了原始數據集，可能您可能需要做一些額外的清理工作才能使它執行所需的操作。我發現tipo.organización的內容與開頭的內容之間存在很多差異nombre.establecimiento ：帶重音/不帶重音的字符，多余的單詞等。當然，您可能已經在這樣做了！指向清理數據集的鏈接將有助於檢查這一部分問題。）

根據另一個數據列中的值刪除字符串的一部分

問題描述

1 個解決方案

解決方案1
0 2019-01-21 18:03:21

根據另一個數據列中的值刪除字符串的一部分

問題描述

1 個解決方案

解決方案1 0 2019-01-21 18:03:21

解決方案1
0 2019-01-21 18:03:21