本文共 915 字,大约阅读时间需要 3 分钟。
pgpool-II在运行在 replication mode的时候,性能低下。
经过分析,发现无解:这是由pgpool-II的执行方式决定的。
pgpool-II 刚开始运行的时候,就会开很多子进程,缺省值128。 但是,每当客户端来一个请求,就会有一个子进程全权负责,别的子进程不插手。而在replication mode,该子进程需要和多个DB节点打交道:
比如把客户端的SQL文,发送给每一个DB节点。 在给各个节点发送SQL文的时候,如果想要效率高,要么开子进程或线程来并行。要么采用某种非阻塞方式向各个节点发请求。然而,pgpool-II的开发者,采用了效率最为低下的做法:顺次执行。就是说对第一个DB节点发SQL文,待第一个DB节点运行此SQL文结束,再向第二个DB节点发SQL文。
此种做法,如果运行在业务不繁忙的系统里尚可,在繁忙的系统里,那就是致命的缺陷。
验证如下:先在各个DB节点,作如下的函数:
CREATE FUNCTION loopforid()RETURNS INTEGER LANGUAGE plpgsql AS $$ DECLARE ret INTEGER; BEGIN PERFORM pg_sleep(30); ret:=100; RETURN ret; END; $$;
然后,在pgpool-II中执行类似:update a8 set id=(select loopforid() ) where id=10; 的操作。
再来看pgpool-II的log,可以看到:
在DB1 节点执行完毕后,又过了大约30秒,才开始在DB2节点执行。所以说,它是串行的。
因此,当后台DB节点增加的时候,通过pgpool-II的replication mode来运行的程序,其insert/update/delete性能将随着节点数目的增加而成比例下降。
本文转自健哥的数据花园博客园博客,原文链接:http://www.cnblogs.com/gaojian/archive/2012/08/08/2627868.html,如需转载请自行联系原作者