繁体   English   中英

基于月的 Oracle SQL 数据迁移行到列

[英]Oracle SQL data migration row to column based in month

CODE1   CODE2   CODE3   RATE    VALUE   MONTH
A       B       C       1       1       202001
A       B       C       1       1       202002
A       B       C       1       1       202003
A       B       C       2       1       202004
A       B       C       2       1       202005
A       B       C       1       1       202006
A       B       C       1       1       202007
A       B       C       1       1       202008
A       B       C       1       1       202009

我正在将数据从旧系统迁移到新系统。 作为每月维护的旧系统数据的一部分,如果数据更新并且表包含一个月的一行,我将更新同一行我正在迁移到新闻系统,它包含开始日期和结束日期以进行活动记录。 所以在更新新数据时需要插入并更新旧行结束日期

我的预期数据

CODE1   CODE2   CODE3   RATE    VALUE   START_DT    END_DT
A       B       C       1       1       20200101    20200331
A       B       C       2       1       20200401    20200531
A       B       C       1       1       20200601    99991230

如果数据处于活动状态,我们会将日期更新为无穷大,所以 999912

但我只得到两条记录,我的查询如下

CODE1   CODE2   CODE3   RATE    VALUE   START_DT    END_DT
A       B       C       2       1       20200401    20200531
A       B       C       1       1       20200601    99991230


SELECT CODE1, CODE2, CODE3 RATE, VALUE,
 TO_DATE(MIN(bus_month), 'yyyymm') AS START_DT,
 last_day(TO_DATE(replace(MAX(bus_month), $CURRENTMONTG, '999912'), 'yyyymm')) AS end_date
FROM TEST_TABLE
GROUP BY CODE1, CODE2, CODE3, RATE, VALUE

由于我根据 CODE1、CODE2、CODE3、RATE、VALUE 进行分组并根据分组获取最新数据,但我无法获取旧数据

请帮助我获得预期的表结构。 提前致谢

如果需要更多详细信息,请发表评论

这是一个间隙和孤岛问题,您希望将具有相同比率和值的“相邻”行组合在一起。

一种方法使用行号之间的差异来构建组。 假设这三个代码定义了基组,并且您希望在比率或值发生变化时分成一个新行:

select code1, code2, code3, rate, value, min(month) start_dt, 
    case when row_number() over(partition by code1, code2, code3 order by max(month) desc) = 1 then 999912 else max(month) end end_dt
from (
    select t.*,
        row_number() over(partition by code1, code2, code3 order by month) rn1,
        row_number() over(partition by code1, code2, code3, rate, value order by month) rn2
    from mytable t
) t
group by code1, code2, code3, rate, value, rn1 - rn2
order by start_dt

外部查询中的条件表达式将“最后”期间的结束日期设置为999912

DB Fiddle 上的演示

CODE1 | CODE2 | CODE3 | RATE | VALUE | START_DT | END_DT
:---- | :---- | :---- | ---: | ----: | -------: | -----:
A     | B     | C     |    1 |     1 |   202001 | 202003
A     | B     | C     |    2 |     1 |   202004 | 202005
A     | B     | C     |    1 |     1 |   202006 | 999912

您可以使用MATCH_RECOGNIZE对数据进行逐行比较:

SELECT code1,
       code2,
       code3,
       rate,
       value,
       start_dt,
       CASE end_dt
       WHEN TO_NUMBER( TO_CHAR( SYSDATE, 'YYYYMM' ) )
       THEN 999912
       ELSE end_dt
       END AS end_dt
FROM   table_name
MATCH_RECOGNIZE (
   PARTITION BY code1, code2, code3
   ORDER BY     month
   MEASURES     FIRST( rate ) AS rate,
                FIRST( value ) AS value,
                FIRST( month ) AS start_dt,
                LAST( month ) AS end_dt
   ONE ROW PER MATCH
   PATTERN      (FIRST_ROW EQUAL_ROWS*)
   DEFINE       EQUAL_ROWS AS (
                      EQUAL_ROWS.rate  = PREV(EQUAL_ROWS.rate)
                  AND EQUAL_ROWS.value = PREV(EQUAL_ROWS.value)
                  AND TO_DATE( EQUAL_ROWS.month, 'YYYYMM' )
                        = ADD_MONTHS( TO_DATE( PREV(EQUAL_ROWS.month), 'YYYYMM' ), 1 )
                )
)

因此,对于您的示例数据:

CREATE TABLE table_name ( CODE1, CODE2, CODE3, RATE, VALUE, MONTH ) AS
SELECT 'A', 'B', 'C', 1, 1, 201912 FROM DUAL UNION ALL
SELECT 'A', 'B', 'C', 1, 1, 202001 FROM DUAL UNION ALL
SELECT 'A', 'B', 'C', 1, 1, 202002 FROM DUAL UNION ALL
SELECT 'A', 'B', 'C', 1, 1, 202003 FROM DUAL UNION ALL
SELECT 'A', 'B', 'C', 2, 1, 202004 FROM DUAL UNION ALL
SELECT 'A', 'B', 'C', 2, 1, 202005 FROM DUAL UNION ALL
SELECT 'A', 'B', 'C', 1, 1, 202006 FROM DUAL UNION ALL
SELECT 'A', 'B', 'C', 1, 1, 202007 FROM DUAL UNION ALL
SELECT 'A', 'B', 'C', 1, 1, 202008 FROM DUAL UNION ALL
SELECT 'A', 'B', 'C', 1, 1, 202009 FROM DUAL;

这输出:

\n CODE1 | 代码2 |  CODE3 | 价格 | 价值 |  START_DT |  END_DT\n :---- |  :---- |  :---- |  ---: |  ----: |  -------: |  -----:\n一个 | 乙 |  C |  1 |  1 |  201912 |  202003\n一个 | 乙 |  C |  2 |  1 |  202004 |  202005\n一个 | 乙 |  C |  1 |  1 |  202006 |  999912\n

db<> 在这里摆弄

甲骨文SQL:

SELECT
     code1,code2,code3,rate,value,min(MONTH) start_dt,
     CASE
          WHEN ROW_NUMBER() OVER(PARTITION BY code1, code2, code3 ORDER BYmax(MONTH) DESC) = 1 THEN 99991230
          ELSE max(MONTH)
     END end_dt
FROM
     (
     SELECT
          t.*,
          ROW_NUMBER() OVER(PARTITION BY code1, code2, code3 ORDER BY MONTH) rn1,
          ROW_NUMBER() OVER(PARTITION BY code1, code2, code3, rate, value ORDERBY MONTH) rn2
     FROM
          TBLTEST t
) t
GROUP BY
     code1,code2,code3,rate,value,rn1 - rn2
ORDER BY
     start_dt

以自然的思维方式执行任务是相当简单的。 我们比较前五列行之间的相邻值,当值相同时将当前行和上一行放在同一组中,如果不同则创建一个新组,直到比较最后一条记录。 由于SQL集合是无序的,我们需要先手动创建两列索引,非常复杂,然后根据两列索引之间的关系进行分组。 您需要非常聪明才能提出解决方案。

然而,使用开源 esProc SPL 编写代码很容易:

一种
1 =connect("oracle")
2 =A1.query@x("SELECT * FROM TBLTEST ORDER BY MONTH")
3 =A2.groups@o(CODE1,CODE2,CODE3,RATE,VALUE;min(MONTH)/"01":STARTDT,string(date((max(MONTH)+1)/"01","yyyyMMdd")- 1,"yyyyMMdd"):ENDDT)
4 >A3.m(-1).修改("99991230":ENDDT)

SPL 直接支持有序集,便于在相邻值不同时进行分组。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM