簡體 English 中英

mysql讀取->處理->更新，針對大量數據進行優化

[英]mysql read -> process -> update, optimize for huge data

原文 2018-02-24 15:41:12 1 1 python/ mysql/ optimization/ distributed-computing

我有一個簡單的任務。 從mysql讀取數據->執行一些操作（不是很重）->然后將結果更新回mysql DB`。 數據庫中有20個不同的表（每個表約600000行）。

我已經使用ThreadPoolExecutor(max_workers=20)編寫了一個python腳本來優化總體執行時間，但是大約需要40個小時。 我想對其進行優化以用於下一次運行。

我嘗試運行多個代碼實例，但性能不是很重要。 有沒有更好的方法來快速完成任務，例如分布式代碼或任何其他人都知道的東西？

簡約的代碼算法

conn.autocommit = True
ThreadPoolExecutor(max_workers=20)

讀取數據並按元組處理元組，如下所示
使用TextBlob（）。detect_language（）從句子中檢測語言
更新回表

1 個解決方案

最快的方法是創建插入並每隔幾千行提交一次。 將所有內容寫入文件。 刪除索引使用mysql客戶端和creata索引加載數據。 優化服務器以進行批量操作。

Python中的並行性不起作用。 python中的並行性無法正常工作

如何優化大量數據的 postgres 插入/更新請求？

[英]How can I optimize postgres insert/update request of huge amount of data?

在MySQL中查詢大量數據

[英]Querying Huge Data in MySQL

mysql 服務器在使用 pd.read_sql() 獲取大量數據集時失去連接

[英]mysql server loses connection while fetching huge data set using pd.read_sql()

在python中讀取巨大的MySQL表的最快方法

[英]Fastest way to read huge MySQL table in python

優化數據上傳（MySQL，Python）

[英]Optimize data Upload (MySQL,Python)

通過龐大的列表優化循環

[英]Optimize for loop with huge lists

讀取並繪制從大文件中讀取的數據的圖形

[英]Reading and graphing data read from huge files

有效地從巨大的CSV文件中讀取數據

[英]read data from a huge CSV file efficiently

使用 python 清除大量數據 mysql 表

[英]purging a huge data mysql table using python

如何在python中讀取Excel數據並優化代碼

[英]how to read excel data and optimize code in python

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何優化大量數據的 postgres 插入/更新請求？在MySQL中查詢大量數據 mysql 服務器在使用 pd.read_sql() 獲取大量數據集時失去連接在python中讀取巨大的MySQL表的最快方法優化數據上傳（MySQL，Python）通過龐大的列表優化循環讀取並繪制從大文件中讀取的數據的圖形有效地從巨大的CSV文件中讀取數據使用 python 清除大量數據 mysql 表如何在python中讀取Excel數據並優化代碼

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM