Postgres 9.4 или новее
Используется WITH ORDINALITY
для функций, возвращающих набор:
Когда функция в FROM
предложении имеет суффикс WITH ORDINALITY
,
bigint
к выходным данным добавляется столбец, который начинается с 1 и увеличивается на 1 для каждой строки выходных данных функции. Это наиболее полезно в случае набора возвращающих функций, таких как unnest()
.
В сочетании с LATERAL
функцией в pg 9.3+ и согласно этой теме на pgsql-hackers , вышеуказанный запрос теперь можно записать как:
SELECT t.id, a.elem, a.nr
FROM tbl AS t
LEFT JOIN LATERAL unnest(string_to_array(t.elements, ','))
WITH ORDINALITY AS a(elem, nr) ON TRUE;
LEFT JOIN ... ON TRUE
сохраняет все строки в левой таблице, даже если табличное выражение справа не возвращает строк. Если это не вызывает беспокойства, вы можете использовать эту эквивалентную, менее подробную форму с неявным CROSS JOIN LATERAL
:
SELECT t.id, a.elem, a.nr
FROM tbl t, unnest(string_to_array(t.elements, ',')) WITH ORDINALITY a(elem, nr);
Или проще, если на основе фактического массива ( arr
являющегося столбцом массива):
SELECT t.id, a.elem, a.nr
FROM tbl t, unnest(t.arr) WITH ORDINALITY a(elem, nr);
Или даже с минимальным синтаксисом:
SELECT id, a, ordinality
FROM tbl, unnest(arr) WITH ORDINALITY a;
a
автоматически является псевдонимом таблицы и столбца. Имя по умолчанию для добавленного столбца порядковых номеров - ordinality
. Но лучше (безопаснее, чище) добавлять явные псевдонимы столбцов и столбцы, соответствующие таблице.
Postgres 8.4 - 9.3
С row_number() OVER (PARTITION BY id ORDER BY elem)
вы получите номер в соответствии с порядком сортировок, а не порядковый номером оригинальной порядковой позиции в строке.
Вы можете просто опустить ORDER BY
:
SELECT *, row_number() OVER (PARTITION by id) AS nr
FROM (SELECT id, regexp_split_to_table(elements, ',') AS elem FROM tbl) t;
Хотя это обычно работает, и я никогда не видел, чтобы он терпел неудачу в простых запросах, PostgreSQL ничего не утверждает относительно порядка строк без ORDER BY
. Так получается из-за детали реализации.
Чтобы гарантировать порядковые номера элементов в строке, разделенной пробелами :
SELECT id, arr[nr] AS elem, nr
FROM (
SELECT *, generate_subscripts(arr, 1) AS nr
FROM (SELECT id, string_to_array(elements, ' ') AS arr FROM tbl) t
) sub;
Или проще, если на основе фактического массива :
SELECT id, arr[nr] AS elem, nr
FROM (SELECT *, generate_subscripts(arr, 1) AS nr FROM tbl) t;
Связанный ответ на dba.SE:
Postgres 8.1 - 8.4
Ни одна из этих функций не доступны, но: RETURNS TABLE
, generate_subscripts()
, unnest()
, array_length()
. Но это работает:
CREATE FUNCTION f_unnest_ord(anyarray, OUT val anyelement, OUT ordinality integer)
RETURNS SETOF record
LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) + 1
FROM generate_series(array_lower($1,1), array_upper($1,1)) i';
Обратите внимание, в частности, что индекс массива может отличаться от порядковых позиций элементов. Рассмотрим эту демонстрацию с расширенной функцией :
CREATE FUNCTION f_unnest_ord_idx(anyarray, OUT val anyelement, OUT ordinality int, OUT idx int)
RETURNS SETOF record
LANGUAGE sql IMMUTABLE AS
'SELECT $1[i], i - array_lower($1,1) + 1, i
FROM generate_series(array_lower($1,1), array_upper($1,1)) i';
SELECT id, arr, (rec).*
FROM (
SELECT *, f_unnest_ord_idx(arr) AS rec
FROM (VALUES (1, '{a,b,c}'::text[])
, (2, '[5:7]={a,b,c}')
, (3, '[-9:-7]={a,b,c}')
) t(id, arr)
) sub;
id | arr | val | ordinality | idx
1 | {a,b,c} | a | 1 | 1
1 | {a,b,c} | b | 2 | 2
1 | {a,b,c} | c | 3 | 3
2 | [5:7]={a,b,c} | a | 1 | 5
2 | [5:7]={a,b,c} | b | 2 | 6
2 | [5:7]={a,b,c} | c | 3 | 7
3 | [-9:-7]={a,b,c} | a | 1 | -9
3 | [-9:-7]={a,b,c} | b | 2 | -8
3 | [-9:-7]={a,b,c} | c | 3 | -7
Сравните:
WITH ORDINALITY
предпочтительнееgenerate_subscripts()
? Мне кажется,generate_subscripts()
лучше, поскольку он показывает фактическое расположение элемента в массиве. Это полезно, например, при обновлении массива ... следует ли использоватьWITH ORDINALITY
вместо этого?WITH ORDINALITY
это общее решение для получения номеров строк для любой функции возврата набора в запросе SQL. Это самый быстрый и надежный способ, и он также отлично работает для одномерных массивов на основе 1 (по умолчанию для массивов Postgres, учтите это ). Если вы работаете с любыми другими типами массивов (большинство людей этого не делают), и вам действительно нужно сохранить / работать с исходными индексами, тогдаgenerate_subscripts()
это правильный путь. Ноunnest()
для начала все сглаживает ...Table functions appearing in FROM can also be preceded by the key word LATERAL, but for functions the key word is optional; the function's arguments can contain references to columns provided by preceding FROM items in any case.
Пытаться:
select v.*, row_number() over (partition by id order by elem) rn from (select id, unnest(string_to_array(elements, ',')) AS elem from myTable) v
источник
Используйте функции генерации нижнего индекса .
http://www.postgresql.org/docs/current/static/functions-srf.html#FUNCTIONS-SRF-SUBSCRIPTS
Например:
SELECT id , elements[i] AS elem , i AS nr FROM ( SELECT id , elements , generate_subscripts(elements, 1) AS i FROM ( SELECT id , string_to_array(elements, ',') AS elements FROM myTable ) AS foo ) bar ;
Проще:
SELECT id , unnest(elements) AS elem , generate_subscripts(elements, 1) AS nr FROM ( SELECT id , string_to_array(elements, ',') AS elements FROM myTable ) AS foo ;
источник
Если порядок элементов не важен, вы можете
select id, elem, row_number() over (partition by id) as nr from ( select id, unnest(string_to_array(elements, ',')) AS elem from myTable ) a
источник
unnest2()
как упражнениеБолее старые версии до pg v8.4 нуждаются в определяемом пользователем
unnest()
. Мы можем адаптировать эту старую функцию для возврата элементов с индексом:CREATE FUNCTION unnest2(anyarray) RETURNS setof record AS $BODY$ SELECT $1[i], i FROM generate_series(array_lower($1,1), array_upper($1,1)) i; $BODY$ LANGUAGE sql IMMUTABLE;
источник
RETURNS TABLE
еще нет. Я добавил к своему ответу главу, в которой обсуждает решение.setof record
.