繁体   English   中英

如何将大查询中的表作为 pandas dataframe 保存到 colab 中?

[英]How do I save a table from big query into colab as a pandas dataframe?

我是 BQ 的新手,我想在我的 colab 环境中将我的 BQ 表保存为 pandas dataframe。 这是我正在使用的代码,但我收到“错误请求错误”。 有什么想法可以解决问题吗? 我无法弄清楚我做错了什么。 我的代码如下:

from google.cloud import bigquery

client = bigquery.Client(project=project_id)

sample_count = 2000
row_count = client.query('''
  SELECT 
    COUNT(*) as total
  FROM `123.cleaned_sales`''').to_dataframe().total[0]

df = client.query('''
  SELECT
    *
  FROM
    `123.cleaned_sales`
  WHERE RAND() < %d/%d
''' % (sample_count, row_count)).to_dataframe()

print('Full dataset has %d rows' % row_count)```

Here is my error message 

[enter image description here][1]


  [1]: https://i.stack.imgur.com/VQOox.png

您共享的图像表明projectIddatasetId在此查询中不应为空:

row_count = client.query('''
  SELECT 
    COUNT(*) as total
  FROM `123.cleaned_sales`''').to_dataframe().total[0]

您必须设置projectId

row_count = client.query('''
  SELECT 
    COUNT(*) as total
  FROM `your_project_id.123.cleaned_sales`''').to_dataframe().total[0]

对第二个查询执行相同的操作。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM