标签[python-bigquery] - 堆栈内存溢出

使用熊猫将时间戳插入bigquery表中 - Insert timestamp into bigquery table using pandas

我在Google bigquery中有一个表，其中一列设置为数据类型timestamp。我必须使用pandas的to_gbq函数插入数据。如果我将数据类型设置为字符串而不是时间戳，则数据将加载到表中。但我希望该列为时间戳数据类型。数据框的列类型如何转换为与Goog ...

如何解释Bigquery中的查询过程GB？ - How to interpret query process GB in Bigquery?

我正在使用Google bigquery的免费试用版。这是我正在使用的查询。预计此查询最多返回300条记录，并且不超过该数量。但是我看到这样的消息如下但是该查询所依据的表确实很大。这是否表示表格大小？但是，我一天多次运行此查询因此，导致以下错误 ...

使用Python客户端将CSV附加到BigQuery表 - Appending CSV to BigQuery table with Python client

每周我都会以相同的格式创建一个新的CSV文件，我需要使用Python客户端将其附加到BigQuery表中。我使用第一个CSV成功创建了表格，但不确定如何追加后续的CSV。我发现的唯一方法是google.cloud.bigquery.client.Client（Client。）。inser ...

python bigquery库DB-API接口如何支持WHERE IN或WHERE ANY子句 - How python bigquery library DB-API interface supports WHERE IN or WHERE ANY clause

我正在使用python bigquery库https://googleapis.dev/python/bigquery/latest/index.html的DB-API接口。当我将参数传递给WHERE IN或WHERE ANY子句的Cursor.execute（）时，它将引发如下错误 ...

如何在Bigquery中使用Except子句？ - How to use Except clause in Bigquery?

我试图使用Bigquery中现有的Except子句。请在下面找到我的查询如你所见，我正在使用3张桌子。所有3个表都有hosp_id列，所以我想删除重复的列b.hosp_id和c.hosp_id 。同样地，我想删除b.person_id列。当我执行上面的查询时，我得到 ...

Apache Beam +大查询表读取 - Apache Beam + Big Query Table Read

我在项目中的大查询中有数据集：项目：project-x表：table01数据集：dataset01 我想从Apache Beam连接到它并读取例如一栏column01的值... 这就是我所拥有的： import apache_beam as beam from apache_bea ...

如何在python中一起使用多个bigquery项目 - How can I use multiple bigquery projects together in python

假设我有一个很大的查询项目A和B。我需要将项目A的表与项目B联接。如何使用python联接两个项目。在上面的代码中，我只能使用一个project_id。如果我需要使用多个代码，该怎么办？ ...

从GCS导入XLS文件到BigQuery - Import XLS file from GCS to BigQuery

我的Google Cloud Storage中有一些.xls数据，并希望使用气流将其存储到GCP。我可以将其直接导出到BigQuery还是可以使用其他库（例如pandas和xlrd）转换文件并将其存储到BigQuery中？谢谢 ...

使用Python处理查询中的BigQuery错误 - Handle BigQuery error from the querying by using Python

为了处理来自bigquery的错误，我使用了job.errors[0]['message'] ，到目前为止一切都很好。问题出在查询时，例如，当您将值除以0时，BigQuery将显示：问题：通过使用PYTHON-如何选择此错误？ ...

顺序增加计数 - Increase Count Sequentially

我有一个跟踪用户何时阅读网站的数据集。用户可以阅读网站，因此用户会在任何时间出现多次。我想创建一个列来跟踪用户阅读特定网站的次数。但是由于它是一个时间序列，因此计数应该是递增的。我大约有28gbs，所以熊猫将无法处理工作量，因此我必须用sql编写它。以下示例数据： ...

BigQuery仅在流式缓冲区中显示值的第一个字母 - BigQuery only shows first letter of value in streaming buffer

我正在使用Python客户端库将数据流式传输到BigQuery中。数据行恰好位于BQ流缓冲区中，但是当我运行查询来查看它时，我只能看到我插入的值的第一个字母。具体来说，我像这样运行一段Python：然后，当我运行SELECT * FROM mytable ，我得到的结果值只 ...

bigquery 存储 API 在创建读取会话时挂起 - bigquery storage api got hang at create read session

我可以使用BigQuery Storage API读取示例公共数据集。但是当我创建自己的数据集时，它开始创建读取会话： client.create_read_session 。即使我授予对数据集的公共读取访问权限，问题仍然存在。即使我授予对数据集的公共读取访问权限，问题仍然存在。 ...

在编写针对bigQuery的查询时，如何使用变量而不是硬编码来写入表名和列名 - While writing query for bigQuery how to write table name and column name using variables instead of hard coding

在下面提到的查询中，projectname-dataset-tableName在查询中进行了硬编码如何以更动态的方式编写相同的内容？ fulltableid属性未返回兼容格式。 ...

如何解决：将BigQuery查询结果与列表进行比较 - How to fix: compairing result of a bigquery query to a list

我是Python的新手，感谢所有帮助。我想要一个小组的活动清单，该小组以4 $的价格购买了： purchase_date(1,1,0,1,1,0,1) ，其中purchase_date是purchase_date日期， arrays indeces+1给出了购买后的天数。 1表示活动日，0 ...

将 bigquery 数据移至 Redshift - Moving bigquery data to Redshift

我需要将我的 bigquery 表移至 redshift。目前，我有一个从 redshift 获取数据的 python 作业，它正在将我的数据增量加载到 redshift 上。这个 python 作业正在读取 bigquery 数据，在服务器中创建一个 csv 文件，在 s3 上删除相同的文 ...

如何通过使用PYTHON获取详细的Big Query错误 - How to get detailed Big Query error by using PYTHON

我正在寻找将此信息作为python消息：但目前，我只能看到第一/第二这是我目前正在使用的上传： ...

插入具有重复的记录列的表中（有问题的屏幕） - Insert into table with record column which is repeated (screen in question)

我在带有结构的bigquery中有表以及浪费数据测试记录的问题我尝试以这种方式插入： query = ( """ INSERT INTO test.qwe (name, nick, test) VALUES(@name, @nick, @test) ...

AttributeError：“客户端”对象没有属性“查询” - AttributeError: 'Client' object has no attribute 'query'

我尝试在jupyter笔记本上的python 2.7中实现bigquery。我认为我的代码是正确的，但出现错误“ AttributeError：'客户端'对象没有属性'查询'” 我收到的错误消息是： ...

从变量将数据插入BQ表时动态处理Bigquery表架构 - Dynamic Handing of Bigquery table schema while inserting data into BQ table from variable

我正在尝试使用需要动态架构处理的python代码将数据追加到BQ表中。谁能为我提供处理上述情况的链接。 ...

Bigquery Python API不支持的数组 - Arrays not supported in Bigquery Python API

对python Bigquery API的支持表明可以使用数组，但是，当从熊猫数据帧传递到bigquery时，会出现pyarrow结构问题。唯一的办法就是删除列，然后对单独的表使用JSON Normalize。这是收到的错误。 NotImplementedError：结构 ...