[英]finding values without a loop in R
我有一个用c()创建的向量v,它具有以下数据:
v[a,b,d,z,e,f], it must be unordered
我有一个txt文件,格式为:
label 1 2 3 ....
b 100 2000 15
z 123 14 12
a 55 565 55
.....
我已经提取了txt文件,该文件由带有strplit的制表符分隔
ext_data<-strsplit(file,"\t")
我想做的是查看向量V的元素是否与label的元素之一匹配,它可以不存在,然后提取txt文件第1列的相应元素,然后提取column的元素2,依此类推
我已经使用for循环进行了匹配,但是花费了太多时间,因为txt文件包含的数据过多,例如(算法上)
for i=1 to length(v)
for pos=2 to ext_data #I put pos=2 because I start in the second row
if match(vector) and ext_data(pos,1)
retrieve data from column C
有什么建议吗?
粗略地讲,我想知道是否可以使用匹配项,但是对于列,也许可以在一行中转换列标签?
只需创建一些测试数据来说明我的解决方案:
testdata <- data.frame(namecol=c("b","r","a","j","z","l","s","n","t"),
v1=sample(1:1000,9),
v2=sample(1:1000,9),
v3=sample(1:1000,9))
vecfind <- c("a","b","d","z","e","f")
使用[[]]
或$
,可以选择数据帧的第一个元素作为向量,然后使用which
和%in%
函数,可以获取数字行索引,然后提取元素,如下所示:
v1_elements <- testdata[which(testdata[[1]] %in% vecfind),2]
v2_elements <- testdata[which(testdata[[1]] %in% vecfind),3]
v3_elements <- testdata[which(testdata[[1]] %in% vecfind),4]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.