![](/img/trans.png)
[英]Data skipping index for Map or pair-wise arrays in Clickhouse?
我正在將一個表從 Postgres 遷移到 Clickhouse,其中一列是一個包含自定義屬性的 jsonb 列。 每個租戶的這些屬性可能不同,因此我們目前在 postgres 中存儲了 10 萬個不同的自定義屬性鍵。 我檢查了Clickhouse 的半結構化 JSON 數據選項,看來我們可以使用 ...
[英]Data skipping index for Map or pair-wise arrays in Clickhouse?
我正在將一個表從 Postgres 遷移到 Clickhouse,其中一列是一個包含自定義屬性的 jsonb 列。 每個租戶的這些屬性可能不同,因此我們目前在 postgres 中存儲了 10 萬個不同的自定義屬性鍵。 我檢查了Clickhouse 的半結構化 JSON 數據選項,看來我們可以使用 ...
[英]Clickhouse: Want to extract data from Array(Nested) column in Clickhouse
用於創建表的查詢: 表數據: 職位名稱列表數據工作1 [[(1,2,'name1')],[(4,5,'name2')]] 工作2 [[(22,33,'name3')],[(44,55,'name4')]] 預計 Output: 職位名稱列表數據.s 列表數據.e 列表數據名稱工作1 1個 2個 ...
[英]Clickhouse: Want to extract data from Array(Tupple) column in Clickhouse
用於創建表的查詢: CREATE TABLE default.ntest2(job_name String, list_data Array(Tuple(s UInt64, e UInt64, name String))) ENGINE = MergeTree ORDER BY (job_name) ...
[英]How to check missing values in Clickhouse
我有一個表格,每 15 分鍾就會填充一次數據。 我需要檢查是否有整個期間所有天的數據。 有一個時間列,其中數據的格式為 yyyy-mm-dd hh:mm:ss 我找到了開始日期和最后日期我發現你可以從這個間隔(開始日期和結束日期)生成一個日期數組,每一行都將與之進行比較,如果沒有匹配,這里就是缺失的 ...
[英]Too many columns in GROUP BY
我正在嘗試匯總一些數據,但遇到了問題。 這是我的查詢(使用 3 個表): 我必須按幾乎所有列進行GROUP BY 。 這是一個真正的問題嗎? 列ufc.original_join_id , c.name,c.owner_login , c.status , metric_type , metric_ ...
[英]How to check Spark DataFrame difference?
我需要檢查我的解決方案的冪等性,並檢查它與過去的解決方案有多少不同。 接下來我嘗試了: 它告訴我這個表有多少不同(t1 - 我的解決方案,t2 - 原始數據)。 如果這里有很多不同的數據,我想檢查它在哪里不同。 所以,我試過了: 這對我不好,因為它工作了大約 1-2 小時(兩個表都有 30 列和 ...
[英]Joining large tables in ClickHouse: out of memory or slow
我有 3 個大表(>100 GB,每個表有數百萬行): events 、 page_views和sessions 。 這些表通過 1-n 關系連接,請參見下面的表設置。 我正在嘗試創建一個非規范化的events_wide表,其中包含每個事件的一行,其中還包括相應的page_views和ses ...
[英]Too many or too few rows when using different engines when creating one table from another
我正在嘗試從另一個使用創建一個表 當我使用 我從查詢 SELECT...FROM...WHERE 獲得了大約 7-9% 的預期行數當我使用 我比預期多了 3 倍(我假設每一行恰好出現 3 次) 我想要准確的行數而不會丟失且不會重復 ...
[英]insert the csv file data into clickhouse database in the console application using c#
我需要使用 c# 將 csv 文件數據插入到控制台應用程序中的 clickhouse 數據庫中。在 sql 數據庫中,數據正在添加到表中,而在 clickhouse 中,它沒有將數據添加到表中。 數據無法添加到 clickhouse 數據庫中,我也沒有收到任何錯誤 } ...
[英]Why two Kafka brockers for one queue table in clickhouse Kafka engine do not work simultaneously?
我有非常簡單的設置來將數據從 Kafka 插入到 Clickhouse 表。 我的數據stream如下: 但是這個表只從一個broker那里得到數據stream,第一個或者第二個。 但不是同時來自兩個。 對於每個經紀人(如果它被用作唯一的經紀人),它都可以正常工作。 我嘗試將隊列表與一個經紀人一起 ...
[英]Join tables in ClickHouse without equal expressions
我需要在沒有相等表達式的情況下在 ClickHouse 中加入兩個具有“介於”條件的表。 如何實現這個邏輯? 我做了: 然后報錯代碼:403,e.displayText() = DB::Exception:JOIN ON 的表達式無效。 預期等於表達式... ...
[英]Outer Query Column cannot be used in Clickhouse SELECT
我正在嘗試使用基於度量的最大值的 select 行。 因此,每一行都應該根據該行的度量與其自身的最大值進行“比較”。 這可以通過 PostgreSQL 中的以下查詢來完成: 這個 SQL 在 PostgreSQL 中正確運行: 但是,在 Clickhouse 的內部查詢 WHERE 子句中不能使用 ...
[英]Select first and last row for each group
我想在我的 SQL 查詢中找到每個組的第一行和最后一行value之間的增量,但是每次運行的子查詢總是在time_last和last_value列中返回不同的值。 請幫我解決我的查詢。 表 1 包含唯一時間值和重復的名稱和值。 是這樣的: 有問題的子查詢: 我要使用的總計查詢: 返回值:第一次運行: ...
[英]mapping TIMESTAMPTZ to clickhouse datatype
我在 cockroachDB 源中有一個 TIMESTAMPTZ 列,通過使用 clickhouse kafka 消費者從 cockroachDB changefeed 讀取我將 TIMESTAMPTZ 字段存儲為 DateTime 但這導致數據不准確,例如: 1970-01-01 00:00:0 ...
[英]Clickhouse protobuf output format
我在 docker 中使用 clickhouse 服務器,其中只有 1 個表和幾行。 我可以使用clickhouse 客戶端(通過 TCP)或一些 GUI 工具(如 DBeaver(通過 HTTP))以默認格式請求所有數據。 我也可以將格式更改為特殊的格式: 我想以 protobuf 格式從 cli ...
[英]Group by Ranges and Pivot
我正在使用最新版本的 Clickhouse 並嘗試按城市和年齡范圍進行分組/透視。 例如,住在芝加哥的任何人,其中一組是 18-34 歲,然后是 35-45 歲,等等。 我收到There is no supertype for types String, UInt8 because some of ...
[英]Count in time window for each present day in Clickhouse
我有一張表,其中包含使用某些服務的用戶的日志。 類似於下表,每一行都是活動的時間戳和用戶 ID。 用戶身份時間戳 831 2022-06-22 04:37:10 789 2022-06-22 12:38:57 831 2022-06-22 16:40:10 我想計算每天的唯一用戶數,但不 ...
[英]Clickhouse 'lightweight deletes' are not filtered from subsequent queries as expected, only filtered once asynchronous call is complete
我正在嘗試新的 clickhouse 輕量級刪除,它會在下一次合並時刪除行,但會立即異步“標記”它們,以便它們不會顯示在后續查詢中。 我正在關注的指南在這里:https://clickhouse.com/docs/en/sql-reference/statements/delete/ 但這似乎並沒有 ...
[英]Can I create a Materialized View from another Matrialized View in Clickhouse?
瓷磚幾乎說明了這一點。 我想創建一個實體化視圖,其“SELECT”子句從 Clickhouse 中的另一個實體化視圖中選擇數據。 我試過這個。 兩個視圖的“創建”的 SQL 運行沒有錯誤。 但是在運行時,第一個視圖被填充,但第二個視圖沒有。 我需要知道我的 SQL 是否有誤,或者這根本不可能。 這 ...
[英]Clickhouse doesn't use skip index with Final modifer in query
我在 clickhouse 的字段 (status_id) 上添加了一個跳過索引。 當我使用我的查詢時,它被使用並工作,如下所示: 結果: 但是當我使用final修飾符時,跳過索引不再使用: 結果: 我在文檔中找不到任何 Final 關鍵字會阻止 clickhouse 使用跳過索引的內容。 所以我想 ...