[英]How find only directory in string with gsub (or regex) R
我试图从txt文件中读取目录。 在txt文件中,语法如下:
dirScript;"C:/User/Folder_1/R/Script-Folder 1/"
"empty line"
我想要的信息是将var等于一个字符串,其目录如下:
var <- "C:/User/Folder_1/R/Script-Folder 1/"
setwd(var)
我的R代码看起来像这样:
tempString <- str_c(str_extract_all(textInTxtFile, regex("(?<=;).*"), simplify=TRUE), sep="", collapse="")
# Real variable, gsub expression deletes extra backslashes added by functions above
var <- gsub("[^A-Za-z0-9/.:-_; ]", "", tempString)
# Tempstring: "\""C:/User/Folder 1/R/Script-Folder 1/"\""
# Var: "C:/User/Folder 1/R/ScriptFolder 1/"
# *UPDATE* Or like this, seems to work, Safe enough?
var <- gsub('"', "", tempString)
所以我的“ - ”消失了,也就是“_”。 我不明白为什么,我认为我的正则表达式应该在分号之后搜索任何内容“;”,这是错的吗? 也许我不应该使用str_c? (但它有所作为吗?)
另外我如何修复我的gsub不带走“ - ”和(?)“_”? 或者如何修复我的正则表达式以便gsub不是必需的,我的正则表达式或其他函数添加一些反斜杠和引号。
最后有没有办法在找到正确的目录后检查我的目录?
这是一个好主意吗?
dir.create(file.path(mainDir, subDir), showWarnings = FALSE)
setwd(file.path(mainDir, subDir))
from: 检查目录是否存在,如果不存在则创建
额外的问题:如果方向是用反斜杠(windows标准)写的,有没有办法轻松找到,如果是这样我只会使用gsub(“[\\]”,“/”,text)。 我正在考虑只搜索一些反斜杠,如果它比3更大,我使用它,但它不太安全。 Aslo它会在正则表达式中抱怨我认为因为R会将反斜杠解释为转义字符。
所以“额外的问题”是,如何找到并解决这个问题:
dirScript;"C:\User\Folder_1\R\Script-Folder 1\"
"empty line"
我修好了它。 感谢我收到的帮助。
我认为我的主要问题在于gsub-function。 它现在适用于此:
var <- gsub('"', "", tempString)
另外我的str_c和所有的regex表达式可能会添加一些奇怪的东西,它们给了我一个额外的字符串,但是被新的gsub删除了。
另外,我尝试使用反斜杠“\\”的路径,它的工作原理。
我不知道是否提出这个问题,也许不是吗? 评论你的想法。
谢谢您的帮助。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.