R：根据条件分配值

Question

我正在尝试将第一个数据集中的心理调查问卷的测试分数转换为另一个数据集中的标准化分数（百分位数的范围）

测试成绩是参加我问卷调查的9个人中的一项

TestResults <- data.frame(ID = c(1:9),   
               Observed = c(14, 8, 33, 23, 5, 79, 2, 11, 5), Results = NA)

来自测试发布者的评分表，在R中手动实现，此处为简化起见在此处缩短

ScoringSheet <- data.frame(Percentiles = c(99,95,85,55,10), Score = c(79,33,20,15,5))

我想用从ScoringSheet观察到的分数的相应百分数值填充“ Results ”列。 对于计分，应用了一种简单的算法，但我无法在R中实现

1如果TestResults$Observed %in% ScoringSheet$Score ，那么Results应该是对应Percentiles在值ScoringSheet 。
2，如果!(TestResults$Observed %in% ScoringSheet$Score)然后TestResults$Results应该是两者的平均ScoringSheet$Percentiles之间，其中Observed分数瀑布
3如果TestResults$Observed < min(ScoringSheet$Score)则这些最小观察值的Results值应为min(ScoringSheet$Percentiles)/2

结果，我需要这个

TestResults <- data.frame(ID = c(1:9), 
                           Observed = c(14, 8, 33, 23, 5, 79, 2, 11, 5), 
                           Results = c(0.5,0.5,95,90,0.5,99,0.5,0.5,0.5))

到目前为止，我可以在TestResults$Observed和ScoringSheet$Score上使用merge()获得标准1的相应百分位数，为不完全匹配的值创建NA。 我现在想知道如何执行标准2和3。

先感谢您！

Answer 1

可能不是最好的解决方案，但可以做到。 首先，我们对ScoringSheet排序，然后使用match查找精确匹配。 最后，我们遍历未找到完全匹配的所有记录，并在那里应用您的计算。 我添加了一个规则，规定分数何时高于第99个百分位数，即等于最高百分位数。 我还添加了两个条目，以显示下面的代码可以正常工作。

TestResults <- data.frame(ID = c(1:11),   
                          Observed = c(14, 8, 33, 23, 5, 79, 2, 11, 5,100,55), Results = NA) 

ScoringSheet <- data.frame(Percentiles = c(99,95,85,55,10), Score = c(79,33,20,15,5))

ScoringSheet = ScoringSheet[order(ScoringSheet$Score,decreasing = F),]
TestResults$Results = ScoringSheet$Percentiles[match(TestResults$Observed,ScoringSheet$Score)]
for(i in which(is.na(TestResults$Results)))
{
  x = tail(which((TestResults$Observed[i]>ScoringSheet$Score)),1)
  if(!length(x)==0)
  {
    TestResults$Results[i] = mean(ScoringSheet$Percentiles[c(x,min(x+1,nrow(ScoringSheet)))])
  }
  else
  {
    TestResults$Results[i] = ScoringSheet$Percentiles[1]/2
  }
}

输出：

   ID Observed Results
1   1       14    32.5
2   2        8    32.5
3   3       33    95.0
4   4       23    90.0
5   5        5    10.0
6   6       79    99.0
7   7        2     5.0
8   8       11    32.5
9   9        5    10.0
10 10      100    99.0
11 11       55    97.0

希望这可以帮助！

R：根据条件分配值

问题描述

1 个解决方案

解决方案1
0 已采纳 2018-01-23 14:51:59

R：根据条件分配值

问题描述

1 个解决方案

解决方案1 0 已采纳 2018-01-23 14:51:59

解决方案1
0 已采纳 2018-01-23 14:51:59