[英]Is it worth to open multiple database connections for sql insertion
我正在编写一个与海量数据获取相关的项目。 目前我正在使用 .NET Framework 4.8 和 Mysql 包来启动连接并将数据插入数据库服务器。
我将插入大约 400, 000 行/秒。 我担心 SQL 连接可能会成为我程序的瓶颈。 我想知道如果我用 sql 创建一个多线程连接并使用消费者队列插入数据,它会更快,是否值得(优点和缺点)?
在我的直觉中,它会更快,但我不确定它在线程开销方面可以提供多少性能。 我不是 SQL 专家,所以如果有人能解释在多个线程上打开多个 SQL 连接的优缺点,那就太好了。
谣言、观点、传闻、事实、版本相关的基准、一些个人经验等……
多线程将提高吞吐量,但有限制:
批处理:
LOAD DATA
是一次从单个线程INSERT
大量行的最快方法。 但是,如果您包括将文件写入LOAD
的成本,这可能会使其实际上比批量插入慢。INSERT
紧随其后。 但是,当它达到某个限制或“收益递减”时,它会限制在“数百”行。INSERT
查询插入一行的 10 倍。 所以它(或LOAD DATA
)值得用于高速摄取。 (来源:许多不同的定时测试。)数据来源:
加载数据后会发生什么? 当然,这不是一个只写永不读的表。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.