[英]Scaling up a ruby, activerecord, mysql app
我有一个应用...
该应用程序对金融产品进行市场比较 - 对于给定的报价请求,它会联系其他几个网站以获取报价。 然后它会向用户提供结果 - 其详细信息有几个引号。
为了管理这些请求,他们将保存到MySQL,然后我的应用程序启动,获取待处理的引号并将这些引用到线程(所有相同的Linux框)以处理每个站点查找。
我使用JRuby,因为我有线程/数据库相关的问题。 使用Java线程池来控制线程数。 使用当前的硬件/ VPS - 它可以处理大约200个线程。 很多限制似乎与每个线程抓住他们自己的MySQL连接有关 - 抓住报价细节并保存结果。 我们希望处理更多的并发线程,因此寻找扩展的方法。
想知道走哪条路......
从这个链接原因是没有扩大规模与-out? - 看起来这个问题适合运行更多的机器来解决它。
所以,任何关于走哪条路的想法......
干杯,克里斯
我对此类问题的常用方法是密切关注您正在进行的数据库查询并积极地调整它们。 仅检索您需要的内容,跳过未明确使用的列,并且非常谨慎地加载您完全不需要的内容。
您经常会发现,通过添加索引或策略性地对数据库中的某些属性进行反规范化可以获得显着的速度提升,以避免丑陋,耗时的JOIN
操作。
考虑缓存:最快的数据库调用是从未进行过的。 利用Memcached之类的东西来保存适度耗时的记录检索结果并不难,如果仔细完成,即使通过几种方法引导您的更新,也很容易使其失效并过期。
对于调度工作程序,可以在Redis中实现一个简单的先进先出队列,以从MySQL本身卸载大量处理开销。 如果您按照示例添加,这通常非常简单。
像Memcached这样的缓存可以处理极高的流量,因此只要有可能,就要对其进行缓存,以避免因为最后的事情而访问数据库。
如果您已经用尽了这些选项,那么就需要更多的前端服务器和更多的数据库容量,但只有这样。
排队是最容易实现的事情。 使用这样的东西: http : //beanstalkd.github.com/beaneater/
基本上,您可以使用async.
前置方法async.
这将把它们放入队列并执行它们。 他们排队,工人可以是同一个服务器或不同的服务器。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.