繁体   English   中英

在通用SQL中同时检索(选择)或创建(插入)新行而不会发生冲突

[英]Concurrently retrieve (select) or create (insert) new row in generic SQL without conflicts

我有一个系统,它有一个复杂的主键用于连接外部系统,还有一个快速,小的不透明主键供内部使用。 例如:外部键可能是复合值 - 类似于(给定名称(varchar),系列名称(varchar),邮政编码(char)),内部键是整数(“客户ID”)。

当我收到带有外部密钥的传入请求时,我需要查找内部密钥 - 这里是棘手的部分 - 如果我还没有一个用于给定外部ID的内部密钥,则分配一个新的内部密钥。

显然,如果我一次只有一个客户端与数据库通信,这很好。 SELECT customer_id FROM customers WHERE given_name = 'foo' AND ... ,如果我没有找到值,则INSERT INTO customers VALUES (...) 但是,如果有可能同时从外部系统进入许多请求,并且许多可能同时到达前所未闻所未闻的客户,则存在竞争条件,其中多个客户端可能尝试INSERT新行。

如果我正在修改现有的行,那将很容易; 在执行UPDATE之前,首先简单地SELECT FOR UPDATE ,以获取适当的行级锁。 但是在这种情况下,我没有可以锁定的行,因为该行还不存在!

到目前为止,我已经提出了几个解决方案,但每个解决方案都有一些非常重要的问题:

  1. INSERT上捕获错误,从顶部重新尝试整个事务。 如果交易涉及十几个客户,这是一个问题,特别是如果传入的数据可能每次都以不同的顺序讨论相同的客户。 可能会陷入相互递归的死锁循环,每次冲突都发生在不同的客户身上。 您可以通过重试尝试之间的指数等待时间来缓解此问题,但这是处理冲突的缓慢而昂贵的方法。 此外,这使得应用程序代码变得非常复杂,因为所有内容都需要重新启动。
  2. 使用保存点。 SELECT之前启动保存点,在INSERT上捕获错误,然后再次回滚到保存点和SELECT 保存点不是完全可移植的,它们的语义和功能在数据库之间略有不同; 我注意到的最大的区别是,有时它们似乎是窝,有时它们没有,所以如果我能避免它们会很好。 这只是一个模糊的印象 - 它是不准确的吗? 保存点是标准化的,还是至少实际上是一致的? 此外,保存点使得在同一事务上并行执行操作变得困难,因为您可能无法确切知道您将回滚多少工作,尽管我意识到我可能只需要接受它。
  3. 获取一些全局锁,比如使用LOCK语句( oracle mysql postgres )的表级锁。 这显然会减慢这些操作并导致很多锁争用,所以我宁愿避免它。
  4. 获取更精细,但数据库特定的锁。 我只熟悉Postgres的做法 ,这在其他数据库中肯定不受支持(函数甚至以“ pg_pg_ ),所以这又是一个可移植性问题。 此外,postgres的这种方式需要我将键转换为一对整数,它可能不适合。 是否有更好的方法来获取假设对象的锁?

在我看来,这必须是数据库的常见并发问题,但我没有设法找到它的大量资源; 可能只是因为我不知道规范的措辞。 是否可以在任何标记数据库中使用一些简单的额外语法来执行此操作?

我不清楚为什么你不能使用INSERT IGNORE,它将运行没有错误,你可以检查是否发生插入(修改记录)。 如果插入“失败”,那么您知道密钥已经存在并且您可以执行SELECT。 您可以先执行INSERT,然后执行SELECT。

或者,如果您使用的是MySQL,请使用支持事务的InnoDB。 这样可以更容易回滚。

在主要的多客户交易之前和之外,以自动提交模式执行每个客户的“查找或可能创建”操作。

WRT生成一个不透明的主键,有许多选项,例如,使用guid或(至少使用Oracle)一个序列表。 WRT确保外部密钥是唯一的,对列应用唯一约束。 如果插入因密钥存在而失败,请重新尝试获取。 您可以使用不存在或不存在的插入。使用存储过程可以减少往返次数并提高性能。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM