Моя функция new_customer
вызывается веб-приложением несколько раз в секунду (но только один раз за сеанс). Самое первое, что он делает, это блокирует customer
таблицу (сделать «вставку, если не существует» - простой вариант upsert
).
Насколько я понимаю документы , другие вызовы new_customer
должны просто стоять в очереди, пока все предыдущие вызовы не будут завершены:
LOCK TABLE получает блокировку на уровне таблицы, ожидая при необходимости снятия любых конфликтующих блокировок.
Почему иногда вместо этого происходит взаимоблокировка?
определение:
create function new_customer(secret bytea) returns integer language sql
security definer set search_path = postgres,pg_temp as $$
lock customer in exclusive mode;
--
with w as ( insert into customer(customer_secret,customer_read_secret)
select secret,decode(md5(encode(secret, 'hex')),'hex')
where not exists(select * from customer where customer_secret=secret)
returning customer_id )
insert into collection(customer_id) select customer_id from w;
--
select customer_id from customer where customer_secret=secret;
$$;
ошибка из журнала:
2015-07-28 08:02:58 BST ДЕТАЛИ: Процесс 12380 ожидает ExclusiveLock для отношения 16438 базы данных 12141; заблокирован процессом 12379. Процесс 12379 ожидает ExclusiveLock для отношения 16438 базы данных 12141; заблокирован процессом 12380. Процесс 12380: выбрать new_customer (декодировать ($ 1 :: text, 'hex')) Процесс 12379: выберите new_customer (декодировать ($ 1 :: text, 'hex')) 2015-07-28 08:02:58 Подсказка BST: подробности запроса см. В журнале сервера. 2015-07-28 08:02:58 BST КОНТЕКСТ: SQL-оператор "new_customer" оператор 1 2015-07-28 08:02:58 BST STATEMENT: выберите new_customer (декодировать ($ 1 :: text, 'hex'))
связь:
postgres=# select relname from pg_class where oid=16438;
┌──────────┐
│ relname │
├──────────┤
│ customer │
└──────────┘
редактировать:
Мне удалось получить простой и воспроизводимый контрольный пример. Для меня это выглядит как ошибка из-за какого-то состояния гонки.
схема:
create table test( id serial primary key, val text );
create function f_test(v text) returns integer language sql security definer set search_path = postgres,pg_temp as $$
lock test in exclusive mode;
insert into test(val) select v where not exists(select * from test where val=v);
select id from test where val=v;
$$;
скрипт bash запускается одновременно в двух сеансах bash:
for i in {1..1000}; do psql postgres postgres -c "select f_test('blah')"; done
журнал ошибок (обычно несколько тупиков при 1000 вызовах):
2015-07-28 16:46:19 BST ERROR: deadlock detected
2015-07-28 16:46:19 BST DETAIL: Process 9394 waits for ExclusiveLock on relation 65605 of database 12141; blocked by process 9393.
Process 9393 waits for ExclusiveLock on relation 65605 of database 12141; blocked by process 9394.
Process 9394: select f_test('blah')
Process 9393: select f_test('blah')
2015-07-28 16:46:19 BST HINT: See server log for query details.
2015-07-28 16:46:19 BST CONTEXT: SQL function "f_test" statement 1
2015-07-28 16:46:19 BST STATEMENT: select f_test('blah')
редактировать 2:
@ypercube предложил вариант с lock table
внешней функцией:
for i in {1..1000}; do psql postgres postgres -c "begin; lock test in exclusive mode; select f_test('blah'); end"; done
Интересно, что это устраняет тупики.
источник
customer
используется способ, который бы захватил более слабую блокировку? Тогда это может быть проблемой обновления блокировки.Ответы:
Я опубликовал это в pgsql-bugs, и ответ от Тома Лейна указывает, что это проблема эскалации блокировки, замаскированная механикой способа обработки функций языка SQL. По сути, блокировка, сгенерированная с помощью
insert
, получается до монопольной блокировки таблицы :Это также объясняет, почему блокировка таблицы за пределами функции в оберточном блоке plpgsql (как предлагает @ypercube) предотвращает взаимные блокировки.
источник
Предполагая, что вы выполняете другие операторы перед вызовом new_customer, и те получают блокировку, которая конфликтует
EXCLUSIVE
(в основном, с любым изменением данных в таблице клиентов), объяснение очень простое.Можно воспроизвести проблему на простом примере (даже не включая функцию):
1-й сеанс:
2-я сессия
1-я сессия
Когда первый сеанс выполняет вставку, он получает
ROW EXCLUSIVE
блокировку таблицы. Между тем, сеанс 2 пытается также получитьROW EXCLUSIVE
блокировку и пытается получитьEXCLUSIVE
блокировку. В этот момент он должен ждать 1-го сеанса, посколькуEXCLUSIVE
блокировка конфликтует сROW EXCLUSIVE
. Наконец, 1-й сеанс перепрыгивает акул и пытается получитьEXCLUSIVE
блокировку, но поскольку блокировки получаются по порядку, он ставится в очередь после 2-го сеанса. Это, в свою очередь, ждет 1-го, что приводит к тупику:Решением этой проблемы является получение блокировок как можно раньше, как правило, первым делом в транзакции. С другой стороны, рабочая нагрузка PostgreSQL нуждается в блокировках только в некоторых очень редких случаях, поэтому я бы посоветовал переосмыслить то, как вы выполняете переход (посмотрите на эту статью http://www.depesz.com/2012/06/10 / почему это так сложно / ).
источник
Process 28514 : select new_customer(decode($1::text, 'hex')); Process 28084 : BEGIN; INSERT INTO test VALUES(1); select new_customer(decode($1::text, 'hex'))
Пока Джек только что получил:Process 12380: select new_customer(decode($1::text, 'hex')) Process 12379: select new_customer(decode($1::text, 'hex'))
- это указывает на то, что вызов функции является первой командой в обеих транзакциях (если я что-то не упустил).