oracle sql 中的 JSON_TABLE 未捕获的嵌套 json 数据

Question

我正在使用 Oracle 12c(12.2) 读取表中的 json 数据。

SELECT        jt.name,
jt.employee_id, 
jt.company    
FROM JSON_TABLE ( BFILENAME ('DB_DIR', 'vv.json')

我在 json output 中嵌套了数据。 嵌套数据中的 key:value 以记录的值"past_work": "NA" 。 对于它下面的其他许多记录，具有实际值，例如

"past_work": [{ "company": "XXXXX",   "title": "XXXX"}]

但是因为完成的第一条记录具有值以及开始和结束括号 []，oracle 没有捕获下面的记录嵌套值。 知道如何捕获以下记录吗？

示例：如下所示的实际数据

  SELECT
      jt.company,
      jt.title
    FROM
      JSON_TABLE(
        '{
           "employee_data": [
             { "employee_id": "111",
               "past_work": "N/A"
             },
             { "employee_id": "222",
               "past_work": [
                 {"company": "XXXXX", "title": "XXXX"},
                 {"company": "YYYYY", "title": "YYYY"}
               ]
             },
             { "employee_id": "333",
               "past_work": [
                 {"company": "XXXXX", "title": "XXXX"},
                 {"company": "YYYYY", "title": "YYYY"}
                ]
             }
           ]
         }',
        '$.past_work[*]'
          COLUMNS (
            company VARCHAR2(100) PATH '$.company',
            title   VARCHAR2(100) PATH '$.title'
          )
      )
        AS jt

现在，当我执行上述语句时，我得到 null 用于 emplyee_id 333 及以下的公司价值。

谢谢

Answer 1

如果past_work应该是一个过去(company, title)对的数组，那么编码“no history”的正确方法是不要使用像"N/A"这样的字符串值，而是应该使用一个空数组，正如我在下面的代码中所示。 如果你按照自己的方式去做，你仍然可以提取数据，但它会异常混乱。 如果您使用JSON，请正确使用。

另外，你说你想提取公司和头衔。 就这些？ 这是没有意义的。 相反，您可能希望提取每个员工的员工 ID 以及工作历史。 在工作历史中，我添加了一个“for ordinality”列（以显示哪个公司是第一个，哪个是第二个等）如果您不需要它，只需将其省略即可。

要访问嵌套列，您必须使用columns规范中的nested子句。

select employee_id, ord, company, title
from   json_table(
        '{
           "employee_data": [
             { "employee_id": "111",
               "past_work": [ ]
             },
             { "employee_id": "222",
               "past_work": [
                 {"company": "XXXXX", "title": "XXXX"},
                 {"company": "YYYYY", "title": "YYYY"}
               ]
             },
             { "employee_id": "333",
               "past_work": [
                 {"company": "XXXXX", "title": "XXXX"},
                 {"company": "YYYYY", "title": "YYYY"}
                ]
             }
           ]
         }',   '$.employee_data[*]'
               columns ( 
                         employee_id varchar2(10) path '$.employee_id',
                           nested path '$.past_work[*]'
                               columns (
                                         ord     for ordinality,
                                         company varchar2(10) path '$.company',
                                         title   varchar2(10) path '$.title'
                                       )
                       )
       ) jt
order by employee_id, ord;

Output：

EMPLOYEE_ID ORD COMPANY TITLE
----------- --- ------- -----
111                          
222           1 XXXXX   XXXX 
222           2 YYYYY   YYYY 
333           1 XXXXX   XXXX 
333           2 YYYYY   YYYY

Answer 2

首先，json 代码段格式不正确，它必须被{}包围才能被解析为 json object...

{"past_work": [{ "company": "XXXXX", "title": "XXXX"}]}

然后，您可以告诉 json 解析器您要从past_work元素中提取行...

JSON_TABLE(<yourJsonString>, '$.past_work[*]')

[*]告诉解析器past_work是一个数组，并将该数组处理为 json 对象的行，而不是将整个数组作为单个 json object 返回。

这给出了类似...

SELECT
  jt.company,
  jt.title
FROM
  JSON_TABLE(
    '{
        "past_work": [
            {"company": "XXXXX", "title": "XXXX"},
            {"company": "YYYYY", "title": "YYYY"}
        ]
     }',
    '$.past_work[*]'
      COLUMNS (
        company VARCHAR2(100) PATH '$.company',
        title   VARCHAR2(100) PATH '$.title'
      )
  )
    AS jt

db<>小提琴演示

有关更多详细信息，我建议阅读文档：

https://docs.oracle.com/database/121/SQLRF/functions092.htm#SQLRF56973

编辑：更新的示例，几乎是文档中的复制和粘贴

请阅读文档！

SELECT
  jt.*
FROM
  JSON_TABLE(
    '{
        "XX_data":[
          {
            "employee_id": "E1",
            "full_name":   "E1  Admin",
            "past_work":   "N/A"
          },
          {
            "employee_id": "E2",
            "full_name":   "E2  Admin",
            "past_work": [
              {"company": "E2 PW1 C", "title": "E2 PW1 T"},
              {"company": "E2 PW2 C", "title": "E2 PW2 T"},
            ]
          },
        ]
     }',
    '$.XX_data[*]'
      COLUMNS (
        employee_id VARCHAR2(100) PATH '$.employee_id',
        full_name   VARCHAR2(100) PATH '$.full_name',
        past_work   VARCHAR2(100) PATH '$.past_work',
        NESTED PATH '$.past_work[*]'
          COLUMNS (
            past_work_company VARCHAR2(100) PATH '$.company',
            past_work_title   VARCHAR2(100) PATH '$.title'
          )
      )
  )
    AS jt

另一个 db<>fiddle 演示

Answer 3

感谢大家的评论。 已要求产品团队提供正确格式的数据。

oracle sql 中的 JSON_TABLE 未捕获的嵌套 json 数据

问题描述

3 个解决方案

解决方案1
1 2021-05-08 15:48:37

解决方案2
0 2021-05-08 10:50:17

解决方案3
0 2021-05-11 08:31:29

oracle sql 中的 JSON_TABLE 未捕获的嵌套 json 数据

问题描述

3 个解决方案

解决方案1 1 2021-05-08 15:48:37

解决方案2 0 2021-05-08 10:50:17

解决方案3 0 2021-05-11 08:31:29

解决方案1
1 2021-05-08 15:48:37

解决方案2
0 2021-05-08 10:50:17

解决方案3
0 2021-05-11 08:31:29