簡體 English 中英

處理大量數據的最佳實踐

[英]Best practice for operating on large amounts of data

原文 2010-08-13 22:48:02 3 2 sql/ sql-server/ tsql/ etl

我需要對具有26+百萬行的表進行大量處理：

根據所述列的數據確定每列的正確大小
識別並刪除重復的行。
創建一個主鍵（自動遞增ID）
創建一個自然鍵（唯一約束）
添加和刪除列

請列出有關如何加快此過程的提示以及上面列出的處理順序。

非常感謝。

更新：不必擔心並發用戶。 此外，此表上沒有索引。 該表是從源文件加載的。 全部說完之后，將有索引。

更新：如果您使用的列表與我列出的列表不同，請隨時提及。

根據到目前為止的評論和我發現的工作：

從26+百萬行中創建行的子集。 我發現500,000行效果很好。
刪除不使用的列（如果有）
使用max（len（））在一次掃描中為所有列設置適當的數據類型長度
在列/列上創建一個（如果可能的話）唯一的聚集索引，該索引最終將成為自然鍵。
在所有行上重復步驟2-4

2 個解決方案

如果要刪除某些列，則可能應首先執行此操作。 這將減少您必須為其他操作讀取的數據量。

請記住，在修改數據時，這可能還需要修改包含數據的索引。 因此，如果計划對表進行大量更新，則最好刪除索引，然后再添加索引。

順序：5、2、1、3、4

1：沒辦法解決：從...中選擇Max（Len（...））

2：一切都取決於您認為重復的內容。

3：在線叢書中的ALTER TABLE將告訴您如何操作。 確實沒有辦法加快速度。

4：參見3。

5：參見3。

在SQL中處理大量數據

[英]Handling large amounts of data in SQL

SQL刪除大量數據

[英]SQL delete large amounts of data

GAE數據存儲區大量數據

[英]GAE Datastore Large Amounts of Data

單表 SQL 中潛在大量數據的最佳實踐

[英]Best practice for potentially large amount of data in single table SQL

從具有大量數據的聯接中選擇到表中

[英]Selecting into a Table from a Join with Large Amounts of Data

在SQL Server中存檔大量舊數據

[英]Archiving large amounts of old data in SQL Server

將大量數據加載到Oracle SQL數據庫

[英]Loading large amounts of data to an Oracle SQL Database

SQLite 查詢大量分時數據的性能

[英]SQLite Performance for querying large amounts of tick data

如何從Foxpro刪除大量數據

[英]How to delete large amounts of data from Foxpro

具有大量數據的SQL與NoSQL性能

[英]SQL vs NoSQL performance with large amounts of data

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 在SQL中處理大量數據 SQL刪除大量數據 GAE數據存儲區大量數據單表 SQL 中潛在大量數據的最佳實踐從具有大量數據的聯接中選擇到表中在SQL Server中存檔大量舊數據將大量數據加載到Oracle SQL數據庫 SQLite 查詢大量分時數據的性能如何從Foxpro刪除大量數據具有大量數據的SQL與NoSQL性能

相關標簽

處理大量數據的最佳實踐

問題描述

2 個解決方案

解決方案1
2 已采納 2010-08-13 22:52:35

解決方案2
0 2010-08-13 22:55:24

處理大量數據的最佳實踐

問題描述

2 個解決方案

解決方案1 2 已采納 2010-08-13 22:52:35

解決方案2 0 2010-08-13 22:55:24

解決方案1
2 已采納 2010-08-13 22:52:35

解決方案2
0 2010-08-13 22:55:24