[英]R computing mean, median, variance from file with frequency distribution
我对 R 工具很陌生,我的问题可能有点太明显了。
我有一个包含以下数据的文件:
Score Frequency
100 10
200 30
300 40
如何读取此文件并计算均值、中值、方差和标准差?
如果上表只是没有任何频率信息的原始分数,那么我可以这样做:
x <- scan(file="scores.txt", what = integer())
中位数(x)
等等,但是当给定频率表时,我无法理解如何进行这些计算。
使用read.table
读取数据(read ?read.table
用于从文件中读取)。 然后,通过创建单个分数的向量来扩展数据。 然后我们可以编写一个函数来获取所需的统计信息。 当然,如果您不想编写函数,您可以单独计算每个。
d <- read.table(header = TRUE, text = "Score Frequency
100 10
200 30
300 40")
d2 <- rep(d$Score, d$Frequency) ## expands the data by frequency of score
multi.fun <- function(x) {
c(mean = mean(x), median = median(x), var = var(x), sd = sd(x))
}
multi.fun(d2)
# mean median var sd
# 237.50000 250.00000 4905.06329 70.03616
根据您输入文件的格式,您可以使用read.csv("scores.txt")
。 您可以使用read.csv("scores.txt", sep="\\t")
更改分隔符。 如果您的数据没有标题,则可以使用选项header=F
。
我将使用 a ,
因为这里更容易阅读。
输入文件
Score,Frequency
100,10
200,30
300,40
R 源代码
x <- read.csv("scores.txt")
mean(x$Score)
median(x$Score)
var(x$Score)
mean(x$Score)
sd(x$Score)
R 输出
> mean(x$Score)
[1] 200
> median(x$Score)
[1] 200
> var(x$Score)
[1] 10000
> mean(x$Score)
[1] 200
> sd(x$Score)
[1] 100
如果你想包括频率。
R 源代码
x <- read.csv("scores.txt")
mean(rep(x$Score, x$Frequency))
median(rep(x$Score, x$Frequency))
var(rep(x$Score, x$Frequency))
mean(rep(x$Score, x$Frequency))
sd(rep(x$Score, x$Frequency))
R 输出
> mean(rep(x$Score, x$Frequency))
[1] 237.5
> x <- read.csv("scores.txt")
> mean(rep(x$Score, x$Frequency))
[1] 237.5
> median(rep(x$Score, x$Frequency))
[1] 250
> var(rep(x$Score, x$Frequency))
[1] 4905.063
> mean(rep(x$Score, x$Frequency))
[1] 237.5
> sd(rep(x$Score, x$Frequency))
[1] 70.03616
只需按照您手动完成的方式进行操作:
让 s 是分数向量,f 是频率向量。
Sx = sum(s*f)
Sx2 = sum((s^2)*f)
n = sum(f)
theMean = Sx/n
SSx = Sx2 - n*theMean^2
sVar = SSx/(n-1)
ssd = sqrt(sVar)
这避免了使用 rep,当数字很大时,这很麻烦。
lines <- readLines("scores.txt")[-1]
mat <- matrix(as.numeric(unlist(
strsplit(gsub(".*(\\d+).*(\\d+).*", "\\1,\\2", lines), ","))),
ncol = 2, byrow = TRUE)
print(summary(mat[, 1]))
print(summary(mat[, 2]))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.