[英]Conditional changes of values in a column R
我正在尝试更改“纬度”和“经度”列中的值。 我想放南而不是南(纬度),并使数字为负。 如果是北,我只想放N。我想对经度做同样的事情,然后放字母。 我希望西方是消极的,东方是积极的。
请让我知道我该如何完成!
对于定义为df
的数据帧
# build a sample data frame with two columns, lat and long
df <- data.frame(Lat = c("1.2N", "1.2S", "35.5N", "33.4S"),
Long = c("113.8W", "113.5W", "43.2E", "55.4E"))
# use gsub with signature gsub(PATTERN, REPLACEMENT, X)
# where you use a regex for the pattern and replacement
# and X is your target.
df$Lat <- gsub("(\\d*\\.\\d*)N","\\1", df$Lat, perl = TRUE)
df$Lat <- gsub("(\\d*\\.\\d*)S","-\\1", df$Lat, perl = TRUE)
df$Long <- gsub("(\\d*\\.\\d*)W","\\1", df$Long, perl = TRUE)
df$Long <- gsub("(\\d*\\.\\d*)E","-\\1", df$Long, perl = TRUE)
所以现在剩下的唯一工作就是计算正则表达式,这对R而言并没有什么特别之处,除了在其他任何地方用\\w
,在R中您需要将\\\\w
等。
因此,我们想匹配数字,因此一个正则表达式数字是(R中的) \\\\d
,因此我们想捕获十进制之前和之后的所有数字,这意味着
\\d*.\\d*
但是.
正则表达式中的特殊字符,因此让我们对其进行转义
\\d*\\.\\d*
现在让我们想到N
,我们想在替换中将其删除,因此我们需要对数字进行分组以使它们保持匹配。 我们用括号来做到这一点。 所以,一群人和这封信给我们
(\\d*\\.\\d*)N
我们可以用\\\\1
来指代我们捕获的捕获组。 所以我们的替换正则表达式很简单
\\1 which really means \\d*\\.\\d*
和S类似,我们在每个匹配项的前面添加-
-\\1
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.