SQL中每行的平均值來自多列和空值

Question

我有一個記錄傳感器數據的應用程序，我希望能夠從多個傳感器產生平均值，可以是一個，兩個，三個或很多......

編輯：這些是溫度傳感器，因此0是傳感器可能存儲為數據庫中的值的值。

我的初始起點是這個SQL查詢：

SELECT grid.t5||'.000000' as ts,
avg(t.sensorvalue)  sensorvalue1
, avg(w.sensorvalue)AS sensorvalue2
FROM 
(SELECT generate_series(min(date_trunc('hour', ts))                         
,max(ts), interval '5 min') AS t5   FROM device_history_20865735 where      
 ts between '2015/05/13 09:00' and '2015/05/14 09:00'   ) grid 

 LEFT JOIN device_history_20865735 t ON t.ts >= grid.t5 AND t.ts <  grid.t5 +  interval '5 min' 
 LEFT JOIN device_history_493417852 w ON w.ts >= grid.t5 AND w.ts <  grid.t5 +  interval '5 min' 
--WHERE t.sensorvalue notnull
GROUP  BY grid.t5 ORDER  BY grid.t5

我得到5分鍾的平均值，因為它對我的應用程序更好。

對於sensorvalue1或2，預期的結果具有NULL值：

ts;sensorvalue1;sensorvalue2
"2015-05-13 09:00:00.000000";19.9300003051758;
"2015-05-13 09:05:00.000000";20;
"2015-05-13 09:10:00.000000";;
"2015-05-13 09:15:00.000000";20.0599994659424;
"2015-05-13 09:20:00.000000";;
"2015-05-13 09:25:00.000000";20.1200008392334;

我的目標是計算所有可用傳感器每5分鍾間隔的平均值，因為NULL是一個問題我想到使用CASE語句，所以如果有一個NULL來獲取另一個傳感器的值...

SELECT grid.t5||'.000000' as ts,
CASE 
        WHEN avg(t.sensorvalue) ISNULL  THEN avg(w.sensorvalue)
        ELSE avg(t.sensorvalue)
END AS sensorvalue
,
CASE 
        WHEN avg(w.sensorvalue) ISNULL  THEN avg(t.sensorvalue)
        ELSE avg(w.sensorvalue)
END AS sensorvalue2
FROM 
(SELECT generate_series(min(date_trunc('hour', ts)),max(ts), interval '5 min') AS t5
FROM device_history_20865735 where      
 ts between '2015/05/13 09:00' and '2015/05/14 09:00'   ) grid 

 LEFT JOIN device_history_20865735 t ON t.ts >= grid.t5 AND t.ts <  grid.t5 +  interval '5 min' 
 LEFT JOIN device_history_493417852 w ON w.ts >= grid.t5 AND w.ts <  grid.t5 +  interval '5 min' 
GROUP  BY grid.t5 ORDER  BY grid.t5

但是然后計算平均值我必須在此基礎上做另一個選擇並分配每列數（也就是傳感器），如果它們只是兩個就可以了但是如果有3個或4個傳感器這會變得非常混亂可能是多行傳感器，每行有NULL值......

SQL是使用postgres 9.4從應用程序（使用Python）語法派生的，所以有一種簡單的方法來實現所需的東西，因為我覺得我走的是一條相當復雜的路線......？

編輯＃2：根據您的輸入我已經生成了這個SQL代碼，再次看起來相當復雜，但如果它是可靠和可維護的，請接受您的想法和審查：

SELECT ts, sensortotal, sensorcount,
CASE
    WHEN sensorcount = 0 THEN -1000
    ELSE sensortotal/sensorcount
END AS sensorAvg

FROM (
    WITH grid as (
          SELECT t5
          FROM (SELECT generate_series(min(date_trunc('hour', ts)), max(ts), interval '5 min') as t5
                FROM device_history_20865735
               ) d
          WHERE t5 between '2015-05-13 09:00' and '2015-05-14 09:00'   
         )
    SELECT d1.t5 || '.000000' as ts
           , Coalesce(avg(d1.sensorvalue), 0) + Coalesce(avg(d2.sensorvalue),0) as sensorTotal
           , (CASE
                    WHEN avg(d1.sensorvalue) ISNULL THEN 0
                    ELSE 1
           END + CASE
            WHEN avg(d2.sensorvalue) ISNULL THEN 0
            ELSE 1
           END) as sensorCount

    FROM (SELECT grid.t5, avg(t.sensorvalue) as sensorvalue
          FROM grid LEFT JOIN
               device_history_20865735 t
               ON t.ts >= grid.t5 AND t.ts <grid.t5 +  interval '5 min' 
          GROUP BY grid.t5
         ) d1 LEFT JOIN
         (SELECT grid.t5, avg(t.sensorvalue) as sensorvalue
          FROM grid LEFT JOIN
               device_history_493417852 t
               ON t.ts >= grid.t5 AND t.ts <grid.t5 +  interval '5 min' 
         GROUP BY grid.t5
         ) d2 on d1.t5 = d2.t5
    GROUP BY d1.t5
    ORDER BY d1.t5
) tmp;

謝謝！

Answer 1

要獲得准確的平均值，您需要在連接之前單獨計算每個平均值：

WITH grid as (
      SELECT t5
      FROM (SELECT generate_series(min(date_trunc('hour', ts)), max(ts), interval '5 min') as t5
            FROM device_history_20865735
           ) d
      WHERE t5 between '2015-05-13 09:00' and '2015-05-14 09:00'   
     )
SELECT d1.t5 || '.000000' as ts,
       avg(d1.sensorvalue) as sensorvalue1
       , avg(d2.sensorvalue) as sensorvalue2
FROM (SELECT grid.t5, avg(t.sensorvalue) as sensorvalue
      FROM grid LEFT JOIN
           device_history_20865735 t
           ON t.ts >= grid.t5 AND t.ts <grid.t5 +  interval '5 min' 
      GROUP BY grid.t5
     ) d1 LEFT JOIN
     (SELECT grid.t5, avg(t.sensorvalue) as sensorvalue
      FROM grid LEFT JOIN
           device_history_493417852 t
           ON t.ts >= grid.t5 AND t.ts <grid.t5 +  interval '5 min' 
     GROUP BY grid.t5
     ) d2 on d1.t5 = d2.t5
GROUP BY d1.t5
ORDER BY d1.t5;

Answer 2

聽起來你想要這樣的東西：

(coalesce(value1,0) + coalesce(value2,0) + coalesce(value3,0)) /
(value1 IS NOT NULL::int + value2 IS NOT NULL::int + value3 IS NOT NULL::int)
AS average

基本上，只需要為每一行做數學運算。 唯一“棘手”的部分是如何“計算”非空值 - 我使用了一個演員，但還有其他選項，如：

CASE WHEN value1 IS NULL THEN 0 ELSE 1 END

SQL中每行的平均值來自多列和空值

問題描述

2 個解決方案

解決方案1
0 2015-05-14 10:35:46

解決方案2
0 2015-07-23 00:41:01

SQL中每行的平均值來自多列和空值

問題描述

2 個解決方案

解決方案1 0 2015-05-14 10:35:46

解決方案2 0 2015-07-23 00:41:01

解決方案1
0 2015-05-14 10:35:46

解決方案2
0 2015-07-23 00:41:01