Мы пытаемся обновить / удалить большое количество записей в многомиллиардной таблице строк. Поскольку это популярная таблица, в разных разделах этой таблицы много активности. Любая крупная операция по обновлению / удалению блокируется на длительные периоды времени (так как она ожидает блокировки всех строк, или блокировки страницы, или блокировки таблицы), что приводит к тайм-аутам или занимает несколько дней для выполнения задачи.
Таким образом, мы меняем подход к удалению небольших партий строк одновременно. Но мы хотим проверить, заблокированы ли выбранные (скажем, 100, 1000 или 2000 строк) другим процессом или нет.
- Если нет, тогда приступайте к удалению / обновлению.
- Если они заблокированы, перейдите к следующей группе записей.
- В конце вернитесь к началу и попробуйте обновить / удалить пропущенные.
Это выполнимо?
Спасибо, ToC
Ответы:
Если я правильно понимаю запрос, цель состоит в том, чтобы удалить пакеты строк, в то же время операции DML выполняются со строками по всей таблице. Цель состоит в том, чтобы удалить партию; однако, если какие-либо нижележащие строки, содержащиеся в диапазоне, определенном упомянутым пакетом, заблокированы, то мы должны пропустить этот пакет и перейти к следующему пакету. Затем мы должны вернуться к любым пакетам, которые ранее не были удалены, и повторить нашу первоначальную логику удаления. Мы должны повторять этот цикл до тех пор, пока все требуемые пакеты строк не будут удалены.
Как уже упоминалось, разумно использовать подсказку READPAST и уровень изоляции READ COMMITTED (по умолчанию), чтобы пропустить прошлые диапазоны, которые могут содержать заблокированные строки. Я сделаю еще один шаг и порекомендую использовать уровень изоляции SERIALIZABLE и удаления нибблингов.
SQL Server использует блокировки Key-Range для защиты диапазона строк, неявно включенных в набор записей, считываемых оператором Transact-SQL, при использовании уровня изоляции сериализуемых транзакций ... подробнее здесь: https://technet.microsoft.com /en-US/library/ms191272(v=SQL.105).aspx
Наша цель состоит в том, чтобы с помощью удаления нибблингов удалить отдельные строки и гарантировать, что при их удалении не произойдет никаких изменений в этих строках, то есть нам не нужны фантомные чтения или вставки. Сериализуемый уровень изоляции предназначен для решения этой проблемы.
Прежде чем я продемонстрирую свое решение, я хотел бы добавить, что я не рекомендую переключать уровень изоляции по умолчанию вашей базы данных на SERIALIZABLE и не рекомендую, чтобы мое решение было лучшим. Я просто хочу представить это и посмотреть, куда мы можем пойти отсюда.
Несколько служебных заметок:
Чтобы начать эксперимент, я создам тестовую базу данных, образец таблицы и заполню таблицу 2 000 000 строк.
На этом этапе нам понадобится один или несколько индексов, по которым могут действовать механизмы блокировки уровня изоляции SERIALIZABLE.
Теперь давайте проверим, что наши 2 000 000 строк были созданы
Итак, у нас есть база данных, таблица, индексы и строки. Итак, давайте настроим эксперимент для удаления кусков. Во-первых, мы должны решить, как лучше всего создать типичный механизм удаления кусков.
Как видите, я поместил явную транзакцию в цикл while. Если вы хотите ограничить сбросы журнала, не стесняйтесь размещать их вне цикла. Кроме того, поскольку мы находимся в модели полного восстановления, вы можете создавать резервные копии журналов транзакций чаще, когда выполняете свои мелкие операции по удалению, чтобы обеспечить исключительный рост журнала транзакций.
Итак, у меня есть пара целей с этой настройкой. Во-первых, я хочу свои замки с ключом диапазона; поэтому я стараюсь сделать партии как можно меньше. Я также не хочу негативно влиять на параллелизм в моей "гигантской" таблице; Итак, я хочу взять свои замки и оставить их как можно быстрее. Итак, я рекомендую вам сделать ваши размеры партии маленькими.
Теперь я хочу привести очень короткий пример этой процедуры удаления в действии. Мы должны открыть новое окно в SSMS и удалить одну строку из нашей таблицы. Я сделаю это в неявной транзакции, используя уровень изоляции READ COMMITTED по умолчанию.
Была ли эта строка действительно удалена?
Да, это было удалено.
Теперь, чтобы увидеть наши блокировки, давайте откроем новое окно в SSMS и добавим фрагмент кода или два. Я использую sp_whoisactive Адама Механика, который можно найти здесь: sp_whoisactive
Теперь мы готовы начать. В новом окне SSMS давайте начнем явную транзакцию, которая попытается повторно вставить одну строку, которую мы удалили. В то же время мы запустим нашу операцию удаления.
Код вставки:
Давайте начнем обе операции, начиная с вставки и заканчивая удалением. Мы видим замки с ключом и эксклюзивные замки.
Вставка сгенерировала эти блокировки:
Ликвидировать удалить / выбрать удерживает эти блокировки:
Наша вставка блокирует удаление, как и ожидалось:
Теперь давайте передадим транзакцию вставки и посмотрим, что происходит.
И, как и ожидалось, все транзакции завершены. Теперь мы должны проверить, была ли вставка фантомной, или операция удаления также удаляла ее.
Фактически, вставка была удалена; Итак, фантомная вставка не была разрешена.
Итак, в заключение, я думаю, что истинное намерение этого упражнения не состоит в том, чтобы попытаться отследить каждую отдельную блокировку на уровне строки, страницы или таблицы и попытаться определить, заблокирован ли элемент пакета и, следовательно, потребуется ли нашей операции удаления Подождите. Это, возможно, было целью спрашивающих; однако эта задача является геркулесовой и практически неосуществимой, если не невозможной. Настоящая цель состоит в том, чтобы избежать возникновения нежелательных явлений после того, как мы изолировали диапазон нашей партии собственными замками, а затем предшествовали удалению партии. СЕРИАЛИЗИРУЕМЫЙ уровень изоляции достигает этой цели. Ключ в том, чтобы держать ваши клочки маленькими, вести журнал транзакций под контролем и устранять нежелательные явления.
Если вам нужна скорость, не создавайте гигантские таблицы, которые не могут быть разбиты на разделы, и, следовательно, не сможете использовать переключение разделов для получения самых быстрых результатов. Ключ к скорости - разделение и параллелизм; ключ к страданию - это грызть и блокировать жизнь.
Пожалуйста, дай мне знать, что ты думаешь.
Я создал несколько дополнительных примеров СЕРИАЛИЗИРУЕМОГО уровня изоляции в действии. Они должны быть доступны по ссылкам ниже.
Удалить операцию
Операция вставки
Операции равенства: блокировки диапазона ключей для следующих ключевых значений
Операции равенства: выборка существующих данных по одиночке
Операции равенства: выборка несуществующих данных по одиночке
Операции неравенства - блокировки диапазона ключа по диапазону и следующие ключевые значения
источник
Это действительно хорошая идея для удаления небольшими аккуратными партиями или кусками . Я бы добавил небольшую
waitfor delay '00:00:05'
и в зависимости от модели восстановления базы данных - еслиFULL
, то делаю a,log backup
а еслиSIMPLE
потом делаю a,manual CHECKPOINT
чтобы избежать раздувания журнала транзакций - между партиями.То, что вы говорите, не вполне возможно из коробки (имея в виду ваши 3 пункта). Если приведенное выше предложение -
small batches + waitfor delay
не работает (при условии, что вы проводите надлежащее тестирование), то вы можете воспользоватьсяquery HINT
.Не использовать
NOLOCK
- см кб / 308886 , SQL Server для чтения Консистенция Проблемы Ицик Бен-Ган , Положив NOLOCK везде - Аарон Бертрана и SQL Server NOLOCK HiNT и другие плохие идеи .READPAST
подсказка поможет в вашем сценарии. СутьREADPAST
подсказки такова: если есть блокировка на уровне строк, SQL-сервер не будет ее читать.Во время моего ограниченного тестирования, я нашел очень хорошие пропускную способность при использовании
DELETE from schema.tableName with (READPAST, READCOMMITTEDLOCK)
и настройки уровня изоляции сеанса запроса наREAD COMMITTED
использованиеSET TRANSACTION ISOLATION LEVEL READ COMMITTED
которой является уровень изоляции по умолчанию в любом случае.источник
Обобщая другие подходы, первоначально предложенные в комментариях к вопросу.
Используйте,
NOWAIT
если желаемым поведением является сбой всего чанка, как только обнаружится несовместимая блокировка.Из
NOWAIT
документации :Используйте
SET LOCK_TIMEOUT
для достижения аналогичного результата, но с настраиваемым временем ожидания:Из
SET LOCK_TIMEOUT
документацииисточник
Предположим, у нас есть 2 параллельных запроса:
подключение / сеанс 1: заблокируется строка = 777
подключение / сеанс 2: будет игнорировать заблокированную строку = 777
ИЛИ подключиться / сеанс 2: сгенерирует исключение
источник
Попробуйте отфильтровать что-то вроде этого - это может стать сложным, если вы хотите стать действительно, действительно конкретным. Посмотрите в BOL описание sys.dm_tran_locks
источник
Вы можете использовать NoLOCK во время удаления, и если строки заблокированы, они не будут удалены. Это не идеально, но может помочь вам.
источник
Msg 1065, Level 15, State 1, Line 15 The NOLOCK and READUNCOMMITTED lock hints are not allowed for target tables of INSERT, UPDATE, DELETE or MERGE statements.
, устаревший с 2005