Возврат диапазона поиска на обнуляемый составной индекс?

14

Для следующей схемы и примера данных

CREATE TABLE T
  (
     A INT NULL,
     B INT NOT NULL IDENTITY,
     C CHAR(8000) NULL,
     UNIQUE CLUSTERED (A, B)
  )

INSERT INTO T
            (A)
SELECT NULLIF(( ( ROW_NUMBER() OVER (ORDER BY @@SPID) - 1 ) / 1003 ), 0)
FROM   master..spt_values 

Приложение обрабатывает строки из этой таблицы в порядке кластерного индекса в 1000 фрагментов строки.

Первые 1000 строк извлекаются из следующего запроса.

SELECT TOP 1000 *
FROM   T
ORDER  BY A, B 

Последний ряд этого набора ниже

+------+------+
|  A   |  B   |
+------+------+
| NULL | 1000 |
+------+------+

Есть ли способ написать запрос, который просто просматривает этот составной индексный ключ и затем следует за ним, чтобы получить следующий кусок из 1000 строк?

/*Pseudo Syntax*/
SELECT TOP 1000 *
FROM   T
WHERE (A, B) is_ordered_after (@A, @B)
ORDER  BY A, B 

Наименьшее количество операций чтения, которые мне удалось получить, - 1020, но запрос кажется слишком запутанным. Есть ли более простой способ равной или лучшей эффективности? Возможно, тот, которому удается сделать все это в одном диапазоне поиска?

DECLARE @A INT = NULL, @B INT = 1000

;WITH UnProcessed
     AS (SELECT *
         FROM   T
         WHERE  ( EXISTS(SELECT A
                         INTERSECT
                         SELECT @A)
                  AND B > @B )
         UNION ALL
         SELECT *
         FROM   T
         WHERE @A IS NULL AND A IS NOT NULL
         UNION ALL
         SELECT *
         FROM   T
         WHERE A > @A        
         )
SELECT TOP 1000 *
FROM   UnProcessed
ORDER  BY A,
          B 

введите описание изображения здесь


FWIW: Если столбец Aвыполнен NOT NULLи значение страж -1используются вместо эквивалентного план выполнения , безусловно , выглядит проще

введите описание изображения здесь

Но один оператор поиска в плане по- прежнему выполняет два поиска, а не сворачивает их в один непрерывный диапазон, и логические операции чтения практически одинаковы, поэтому я подозреваю, что, возможно, это почти так же хорошо, как получится?

Мартин Смит
источник
Моя ошибка. Я забыл, что NULLценности всегда на первом месте. (предполагается обратное.) Исправленное состояние в Fiddle
ypercubeᵀᴹ
Да, Oracle отличается от других.
Мартин Смит
SQL Fiddle
Мартин Смит
@ypercube - SQL Server просто выполняет упорядоченное сканирование для этого, к сожалению, поэтому перечитывает все строки, уже обработанные приложением (логическое чтение 2015). Это не стремится к первому ключу(NULL, 1000 )
Мартин Смит
С двумя различными условиями, независимо от того, @Aравно ли оно нулю или нет, кажется, что оно не выполняет сканирование. Но я не могу понять, лучше ли планы, чем ваш запрос. Скрипка-2
ypercubeᵀᴹ

Ответы:

21

Есть ли способ написать запрос, который просто просматривает этот составной индексный ключ и затем следует за ним, чтобы получить следующий кусок из 1000 строк?

Моё любимое решение - использовать APIкурсор:

SET NOCOUNT ON;
SET STATISTICS IO ON;

DECLARE 
    @cur integer,
    -- FAST_FORWARD, AUTO_FETCH, AUTO_CLOSE, CHECK_ACCEPTED_TYPES, FAST_FORWARD_ACCEPTABLE
    @scrollopt integer = 16 | 8192 | 16384 | 32768 | 1048576,
    -- READ_ONLY, CHECK_ACCEPTED_OPTS, READ_ONLY_ACCEPTABLE
    @ccopt integer = 1 | 32768 | 65536, 
    @rowcount integer = 1000,
    @rc integer;

-- Open the cursor and return (up to) the first 1000 rows
EXECUTE @rc = sys.sp_cursoropen
    @cur OUTPUT,
    N'
    SELECT A, B, C
    FROM T
    ORDER BY A, B;
    ',
    @scrollopt OUTPUT,
    @ccopt OUTPUT,
    @rowcount OUTPUT;

IF @rc <> 16 -- FastForward cursor automatically closed
BEGIN
    -- Name the cursor so we can use CURSOR_STATUS
    EXECUTE sys.sp_cursoroption
        @cur, 
        2, 
        'MyCursorName';

    -- Until the cursor auto-closes
    WHILE CURSOR_STATUS('global', 'MyCursorName') = 1
    BEGIN
        EXECUTE sys.sp_cursorfetch
            @cur,
            2,
            0,
            1000;
    END;
END;

SET STATISTICS IO OFF;

Общая стратегия - это одно сканирование, которое запоминает свою позицию между вызовами. Использование APIкурсора означает, что мы можем возвращать блок строк, а не по одной за раз, как в случае с T-SQLкурсором:

Планы выполнения

STATISTICS IOВыход:

Table 'T'. Scan count 1, logical reads 1011, physical reads 0, read-ahead reads 0
Table 'T'. Scan count 1, logical reads 1001, physical reads 0, read-ahead reads 0
Table 'T'. Scan count 1, logical reads 516, physical reads 0, read-ahead reads 0
Пол Уайт 9
источник