繁体 English 中英

如何拆分数据框并对其并行运行自定义功能？

[英]How can I split a dataframe and run custom fuctions on it parallely?

原文 2016-06-21 08:55:30 2 1 r/ revolution-r/ parallel-foreach

我有一个大约25L行的大型数据集，其中应用了“状态”功能。 它是一个标记过程。 在fn内部，对操作进行矢量化处理，并使用apply函数。 c1-c4是我数据中的列。 仍然需要大约5-6个小时来执行fn。

status(mydata)
status <- function (x) {  

x<- subset(x, x$RECORD_TYPE != "INPUT")
x$c1<- as.character(x$c1)
x$c2 <- as.factor(x$c2)
x$c3 <- as.factor(x$c3)
return ( data.frame(cbind( 
         tapply(x$c2,  x$c4, 
           function (x) ifelse (!(any(x=="BAD")), "G", sum(x== "BAD"))) ,
         tapply(x$c2D,  x$c4, 
            function (x) sum (x== "NEG"))  ))) 
                 }

有什么办法可以进一步加快fn的速度。 我在具有16个核心的服务器上工作。 因此，我相信它可以进一步加快。

1 个解决方案

也许data.table方法比尝试并行化代码更快，但是我需要您的数据样本以确保此答案解决了您的问题：

library(data.table)

setDT(mydata)

mydata[ RECORD_TYPE != "INPUT", 
                   .(var1 = ifelse (!(any(c2=="BAD")), "G", sum(c2== "BAD")),
                     var2 = sum (c2D== "NEG")), by= c4]

如何在R中扩展函数以在不同数据集上并行运行？

[英]How can I extend a function in R to run parallely on different datasets?

如何通过正则表达式在数据框中拆分列？

[英]How can I split a column in a dataframe by regex?

如何在r中有条件地拆分数据帧？

[英]How can I split dataframe in r conditionally?

在R中，我如何按日期拆分数据框

[英]In R how can I split a dataframe by date

如何使用dplyr将数据框和平均数据跨行拆分？

[英]How can I split a dataframe and average across rows using dplyr?

如何将数据框中的字符串拆分为多个列

[英]How can I split a character string in a dataframe into multiple columns

如何将数据帧拆分为奇数和偶数年？

[英]How can I split a dataframe into odd and even years?

如何在 R 中对数据帧进行自定义聚合？

[英]How can I make a custom aggregation of a dataframe in R?

如何将数据帧拆分两列，并根据组计算行数更有效

[英]how can I split a dataframe by two columns and count number of rows based on group more efficient

如何根据条件将 R dataframe 行拆分为多行？

[英]How can I split R dataframe rows into multiple rows based on a condition?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何在R中扩展函数以在不同数据集上并行运行？如何通过正则表达式在数据框中拆分列？如何在r中有条件地拆分数据帧？在R中，我如何按日期拆分数据框如何使用dplyr将数据框和平均数据跨行拆分？如何将数据框中的字符串拆分为多个列如何将数据帧拆分为奇数和偶数年？如何在 R 中对数据帧进行自定义聚合？如何将数据帧拆分两列，并根据组计算行数更有效如何根据条件将 R dataframe 行拆分为多行？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM