如何传递R函数参数来子集列

Question

首先，我是新来的人，这是我的第一篇文章，因此，如果我做的不正确，请事先道歉。 我确实花时间先搜索一下，但是找不到我想要的东西。 其次，我很确定自己正在违反一条规则，因为这个问题与我正在参加的“ coursera.org” R编程课程有关（这是作业的一部分），但是截止日期已经过去，并且我现在失败了，我将在下个月重复该主题，然后重试，但是我现在处于损害控制方面，试图找出问题所在。

基本上，下面是我的代码：我想做的是从一系列文件中读取数据。 这些文件有四列，标题分别是：日期，硝酸盐，硫酸盐和ID，并包含各行数据。

我尝试编写的函数应采用文件目录，污染物（因此为硝酸盐或硫酸盐）以及编号文件集的参数，例如文件1和2，文件1至4等。返回函数的平均值应为选定文件中选定污染物的平均值。

我会使用这样的调用来调用函数

pollutantmean("datafolder", "nitrate", 1:3)

并且返回值应该只是一个数字，在这种情况下，这是数据文件1至3中硝酸盐的平均值

好的，我希望我提供了足够的信息。 其他有用的东西是：

操作系统：Ubuntu
语言：R
收到错误消息：
警告消息：在is.na（x）中：is：na（）应用于类型为“ NULL”的非（列表或向量）

就像我说的那样，数据文件是位于文件夹中的一系列文件，具有四列宽，并且行数有所不同。

我的功能代码如下：

pollutantmean <- function(directory, pollutant, id = 1:5) { #content of the function
#create a list of files, a vector I think
files_list <- dir(directory, full.names = TRUE) 
# Now create an empty data frame
dat <- data.frame()

# Next step is to execute a loop to read all the selected data files into the dataframe
for (i in 1:5) { 
    dat <- rbind(dat, read.csv(files_list[i]))
}

#subsets the rows matching the selected monitor numbers
dat_subset <- dat[dat[, "ID"] == id, ]

#identify the median of the pollutant and ignore the NA values
median(dat_subset$pollutant, na.rm = TRUE)

好的，就是这样，通过反复试验，我很确定代码的最后一行“ median(dat_subset$pollutant, na.rm = TRUE) ”似乎是问题所在。 我对污染物的功能（应该是硫酸盐或硝酸盐）传递了一个论点，但似乎dat_subset$pollutant位的代码无法正常工作。 我以某种方式使通过的污染物论点不进入功能体。 理想情况下， dat_subset$pollutant位应等效于dat_subset$nitrate或dat_subset$sulfate具体取决于传递给函数的参数。

Answer 1

如果像示例中那样在对象中传递列名（将其存储在pollutant ），则不能使用$运算符作为子集。 因此，在您的情况下，尝试使用[]进行子集化：

median(dat_subset[,pollutant], na.rm = TRUE)

要么

median(dat_subset[[pollutant]], na.rm = TRUE)

那样有用吗？

如何传递R函数参数来子集列

问题描述

1 个解决方案

解决方案1
1 2014-05-21 18:44:53

如何传递R函数参数来子集列

问题描述

1 个解决方案

解决方案1 1 2014-05-21 18:44:53

解决方案1
1 2014-05-21 18:44:53