繁体   English   中英

在 BigQuery 中读取时,未定义行 XXXX、列 xx-xx 处的 JSON 输入意外结束

[英]Unexpected end of JSON input at undefined line XXXX, columns xx-xx while reading in BigQuery

我在 Bigquery 中有一个表,它有 2 列 - job_idjson_column (JSON 格式的字符串)。 当我试图读取数据并识别一些对象时,它给我错误如下:

SyntaxError:Unexpected end of JSON input at undefined line XXXX, columns xx-xx

它总是给我第 5931 行,第二次我再次执行它给了第 6215 行。

如果它与JSON结构问题有关,我如何知道数字5931对应于哪个行/ job_id 如果我为特定的job_id设置子集,它会返回值,但是当我尝试在整个表上执行时,出现此错误。 我试着查看提到的 row_numbers 处的job_id ,代码对那些job_id工作正常。

你认为它的 JSON 结构问题以及如何识别哪个行/ job_id有这个问题?

表结构: 在此处输入图像描述

代码:

CREATE TEMPORARY FUNCTION CUSTOM_JSON_EXTRACT(json STRING, json_path STRING)
    RETURNS ARRAY<STRING>
    LANGUAGE js AS """
      var result = jsonPath(JSON.parse(json), json_path);
      if(result){return result;} 
      else {return [];}
    """
    OPTIONS (
        library="gs://json_temp/jsonpath-0.8.0.js"
    );

SELECT job_id,dist,gm,sub_gm
FROM lz_fdp_op.fdp_json_file,
UNNEST(CUSTOM_JSON_EXTRACT(trim(conv_column), '$.Project.OpsLocationInfo.iDistrictId')) dist ,
UNNEST(CUSTOM_JSON_EXTRACT(trim(conv_column), '$.Project.GeoMarketInfo.Geo')) gm,
UNNEST(CUSTOM_JSON_EXTRACT(trim(conv_column), '$.Project.GeoMarketInfo.SubGeo')) sub_gm 

这对你有用吗?

WITH 

T AS (
  SELECT
    '1000149.04.14' AS job_id,
    '{"Project":{"OpsLocationInfo":{"iDistrictId":"A"},"GeoMarketInfo":{"Geo":"B","SubGeo":"C"}}}' AS conv_column
)

SELECT
  JSON_EXTRACT_SCALAR(conv_column, '$.Project.OpsLocationInfo.iDistrictId') AS dist,
  JSON_EXTRACT_SCALAR(conv_column, '$.Project.GeoMarketInfo.Geo') AS gm,
  JSON_EXTRACT_SCALAR(conv_column, '$.Project.GeoMarketInfo.SubGeo') AS sub_gm
FROM
  T

BigQuery JSON 函数文档: https ://cloud.google.com/bigquery/docs/reference/standard-sql/json_functions

如何在不使用 unnest 的情况下读取 JSON 对象中的多个数组?

你能用输入样本更好地解释你的评论吗?

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM