Почему SQL Server отказывается обновлять эти статистические данные, кроме полного сканирования?

Я заметил относительно продолжительную (20 минут +) операцию автоматического обновления статистики в ежедневной сборке хранилища данных. Вовлеченная таблица

CREATE TABLE [dbo].[factWebAnalytics](
    [WebAnalyticsId] [bigint] IDENTITY(1,1) NOT NULL,
    [MarketKey] [int] NOT NULL CONSTRAINT [DF_factWebAnalytics_MarketKey]  DEFAULT ((-1)),
    /*Other columns removed*/
 CONSTRAINT [PK_factWebAnalytics] PRIMARY KEY CLUSTERED 
(
    [MarketKey] ASC,
    [WebAnalyticsId] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [MarketKeyPS]([MarketKey])
) ON [MarketKeyPS]([MarketKey])

Это выполняется в Microsoft SQL Server 2012 (SP1) - 11.0.3513.0 (X64), поэтому доступные для записи индексы хранилища столбцов недоступны.

Таблица содержит данные для двух разных ключей Market. Сборка переключает раздел для определенного MarketKey в промежуточную таблицу, отключает индекс columnstore, выполняет необходимые операции записи, восстанавливает хранилище columns, а затем переключает его обратно.

План выполнения для статистики обновления показывает, что он извлекает все строки из таблицы, сортирует их, получает ошибочно оценочное число строк и выливает их на tempdbуровень разлива 2.

Бег

SELECT [s].[name] AS "Statistic",
       [sp].*
FROM   [sys].[stats] AS [s]
       OUTER APPLY sys.dm_db_stats_properties ([s].[object_id], [s].[stats_id]) AS [sp]
WHERE  [s].[object_id] = OBJECT_ID(N'[dbo].[factWebAnalytics]');

шоу

Если я явно попытаюсь уменьшить размер выборки статистики этого индекса до уровня, используемого другими с

UPDATE STATISTICS [dbo].[factWebAnalytics] [PK_factWebAnalytics] WITH SAMPLE 897667 ROWS

Запрос выполняется еще 20 минут +, и план выполнения показывает, что он обрабатывает все строки, а не 897 667 запрошенных образцов.

Статистика, полученная в конце всего этого, не очень интересна и определенно не оправдывает время, затраченное на полное сканирование.

Statistics for INDEX 'PK_factWebAnalytics'.
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Name                            Updated                         Rows                            Rows Sampled                    Steps                           Density                         Average Key Length              String Index                    
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
PK_factWebAnalytics             Jan 22 2016 11:31AM             420072086                       420072086                       2                               0                               12                              NO                                                              420072086                       

All Density                     Average Length                  Columns                         
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
0.5                             4                               MarketKey                       
2.380544E-09                    12                              MarketKey, WebAnalyticsId       

Histogram Steps                 
RANGE_HI_KEY                    RANGE_ROWS                      EQ_ROWS                         DISTINCT_RANGE_ROWS             AVG_RANGE_ROWS                  
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
1                               0                               3.441652E+08                    0                               1                               
2                               0                               7.590685E+07                    0                               1

Есть идеи, почему я сталкиваюсь с таким поведением и какие шаги я могу предпринять, кроме как использовать NORECOMPUTEих?

Репро сценарий здесь . Он просто создает таблицу с кластеризованным PK и индексом columnstore и пытается обновить статистику PK с низким размером выборки. Это не использует разделение - показывает, что аспект разделения не требуется. Однако использование разделения, описанного выше, действительно ухудшает ситуацию, так как переключение раздела и его последующее включение (даже без каких-либо других изменений) увеличит модификацию модификатора на удвоенное количество строк в разделе, таким образом практически гарантируя, что статистика будет считается устаревшим и авто обновляется.

Я попытался добавить некластеризованный индекс в таблицу, как указано в KB2986627 (оба фильтруются без строк, а затем, когда это не удается, нефильтрованный NCI также без эффекта).

В репро не было проблемного поведения в сборке 11.0.6020.0, и после обновления до SP3 проблема теперь исправлена.

sql-server sql-server-2012 statistics Мартин Смит
источник

Первое, что я бы попробовал, - это обновить экземпляр SQL Server с SP1 CU16 с помощью QFE, который у вас есть прямо сейчас, до SP3 CU1 (текущая сборка 2012 года), а затем провести повторное тестирование, чтобы увидеть, является ли поведение таким же.

Например:

ИСПРАВЛЕНИЕ: UPDATE STATISTICS выполняет некорректную выборку и обработку для таблицы с индексом columnstore в SQL Server

... впервые выпущенный в SP2 CU2 может быть актуальным.

Тем не менее, я не уверен, что 2012 columnstore поддерживает шаблон таблицы, необходимый для выборочной статистики. Я обновлю этот ответ, как только в вопросе появится репро.

Пол Уайт 9
источник

(Относительно последнего параграфа)

SELECT WebAnalyticsId, MarketKey from [dbo].[factWebAnalytics] TABLESAMPLE (897667  ROWS) ORDER BY  MarketKey, WebAnalyticsId

проходит менее чем за 30 секунд для меня. Он не использует индекс columnstore. Он использует кластерный индекс.

Мартин Смит

Да, это определенно похоже на исправление в более поздних версиях. Я произвел простое воспроизведение здесь pastebin.com/7f4TwmKW и на тестовом сервере с 11.0.5343.0 обнаружил, что мой запрос на выборку размером 10 000 строк был проигнорирован, и все 8 000 000 строк были взяты из выборки i.stack.imgur.com/DbbjZ.png (план почти так же, как в вопросе) - Но я не сталкиваюсь с этим в Microsoft SQL Server 2012 (SP3) (KB3072779) - 11.0.6020.0 (количество выбранных строк составляет 274 649, что довольно близко к предполагаемому числу строк в предыдущая сборка и план используют CI, а не columnstore.)

Мартин Смит

Почему SQL Server отказывается обновлять эти статистические данные, кроме полного сканирования?

Ответы: