繁体   English   中英

将BigQuery数据提取到R以进行预处理和分析

[英]Extracting BigQuery data to R for preprocessing and analysis

我在bigquery中有一个大数据集,并在bigquery中编写SQL查询。 它产生快速的结果。 虽然我想使用R / python进行数据预处理。 我大约。 我的表和R中的200M条记录非常慢。

因此,考虑到数据量,我应该使用bigquery查询还是还有另一种使用R / python的方法,该方法也很快。 或者Google提供了一些可用于创建数据摘要的产品,从而避免了SQL查询。

通常,BigQuery是快速处理大量数据的最佳解决方案。 但是,如果要避免SQL查询,则可能要考虑通过Dataflow管道或使用Dataprep预处理数据(不过请注意,后者处于beta中)。

就像Lefteris之前提到的那样,BigQuery可能是扩展性最好的解决方案。

如果您仍想与R集成,是否已查看bigrquery

https://github.com/r-dbi/bigrquery

https://cloud.google.com/blog/big-data/2017/04/google-cloud-platform-for-data-scientists-using-r-with-google-bigquery

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM