繁体   English   中英

如何在gsub(或regex)R中找到字符串中的目录

[英]How find only directory in string with gsub (or regex) R

我试图从txt文件中读取目录。 在txt文件中,语法如下:

dirScript;"C:/User/Folder_1/R/Script-Folder 1/"
"empty line"

我想要的信息是将var等于一个字符串,其目录如下:

var <- "C:/User/Folder_1/R/Script-Folder 1/"
setwd(var)

我的R代码看起来像这样:

tempString           <- str_c(str_extract_all(textInTxtFile, regex("(?<=;).*"), simplify=TRUE), sep="", collapse="") 

# Real variable, gsub expression deletes extra backslashes added by functions above
var                  <- gsub("[^A-Za-z0-9/.:-_; ]", "", tempString)
# Tempstring: "\""C:/User/Folder 1/R/Script-Folder 1/"\""
# Var: "C:/User/Folder 1/R/ScriptFolder 1/"

# *UPDATE* Or like this, seems to work, Safe enough?
var                  <- gsub('"', "", tempString)

所以我的“ - ”消失了,也就是“_”。 我不明白为什么,我认为我的正则表达式应该在分号之后搜索任何内容“;”,这是错的吗? 也许我不应该使用str_c? (但它有所作为吗?)

另外我如何修复我的gsub不带走“ - ”和(?)“_”? 或者如何修复我的正则表达式以便gsub不是必需的,我的正则表达式或其他函数添加一些反斜杠和引号。

最后有没有办法在找到正确的目录后检查我的目录?

这是一个好主意吗?

dir.create(file.path(mainDir, subDir), showWarnings = FALSE)
setwd(file.path(mainDir, subDir))

from: 检查目录是否存在,如果不存在则创建

额外的问题:如果方向是用反斜杠(windows标准)写的,有没有办法轻松找到,如果是这样我只会使用gsub(“[\\]”,“/”,text)。 我正在考虑只搜索一些反斜杠,如果它比3更大,我使用它,但它不太安全。 Aslo它会在正则表达式中抱怨我认为因为R会将反斜杠解释为转义字符。

所以“额外的问题”是,如何找到并解决这个问题:

dirScript;"C:\User\Folder_1\R\Script-Folder 1\"
"empty line"

我修好了它。 感谢我收到的帮助。

我认为我的主要问题在于gsub-function。 它现在适用于此:

var                  <- gsub('"', "", tempString)

另外我的str_c和所有的regex表达式可能会添加一些奇怪的东西,它们给了我一个额外的字符串,但是被新的gsub删除了。

另外,我尝试使用反斜杠“\\”的路径,它的工作原理。

我不知道是否提出这个问题,也许不是吗? 评论你的想法。

谢谢您的帮助。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM