簡體   English   中英

將BigQuery數據提取到R以進行預處理和分析

[英]Extracting BigQuery data to R for preprocessing and analysis

我在bigquery中有一個大數據集,並在bigquery中編寫SQL查詢。 它產生快速的結果。 雖然我想使用R / python進行數據預處理。 我大約。 我的表和R中的200M條記錄非常慢。

因此,考慮到數據量,我應該使用bigquery查詢還是還有另一種使用R / python的方法,該方法也很快。 或者Google提供了一些可用於創建數據摘要的產品,從而避免了SQL查詢。

通常,BigQuery是快速處理大量數據的最佳解決方案。 但是,如果要避免SQL查詢,則可能要考慮通過Dataflow管道或使用Dataprep預處理數據(不過請注意,后者處於beta中)。

就像Lefteris之前提到的那樣,BigQuery可能是擴展性最好的解決方案。

如果您仍想與R集成,是否已查看bigrquery

https://github.com/r-dbi/bigrquery

https://cloud.google.com/blog/big-data/2017/04/google-cloud-platform-for-data-scientists-using-r-with-google-bigquery

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM