Data

2 jun, 2015

Bit a Bit com Shrink no SQL Server

Publicidade

Shrink, ou como dizem “’shrinkar’ um banco de dados para liberar espaços” sempre foi um assunto na roda de bate papo entre DBAs e desenvolvedores. Na visão DBA, Shrink deveria ser excluído do SQL Server. Já na visão do desenvolvedor, ou até mesmo de analista de infraestrutura, esse comando é mágico.

Shrink no bit

Shrink é um recurso do SQL Server que nos permite diminuir arquivos do banco de dados, seja ele um Primary Database Data File (MDF), Secundary Database Data File (NDF) ou ainda o Log Data File (LDF), mais conhecido como Transaction Log. A execução do Shrink move as páginas sujas (com dados) do final de cada arquivo para o início, realocando, assim, as páginas limpas para o fim do arquivo e no final da operação ocorre o corte, liberando esses espaços em disco de volta para o sistema operacional.

Essa movimentação de páginas não leva em consideração a ordem lógica dos dados, o que gera a fragmentação de índices. Em muitos casos, o Shrink é executado com a ideia de diminuir o tamanho do banco de dados para melhorar a performance. Mas na verdade, o Shrink piora ainda mais a performance, pois ao movimentar as páginas para liberar a maior quantidade de espaço possível para o sistema operacional, as páginas ficam totalmente fora da ordem lógica, consequentemente fragmentando drasticamente os índices, principalmente os clustered.

Além de gerar essa fragmentação (o que trará problemas de performance, pois o plano de execução vai para espaço junto as estatísticas de I/O), essa rotina também gera uma grande sobrecarga de CPU e processamento de I/O, elevando ainda mais o gargalo em seu ambiente.

Vamos simular essa fragmentação. A ideia é cria um banco de dados com duas tabelas, executar uma carga de dados em ambas, realizar o TRUNCATE em uma delas e depois executar o Shrink. Tudo isso para simular um expurgo de dados onde normalmente o pessoal executa o Shrink após esse tipo de manutenção no banco de dados para liberar os espaço em disco dos dados que foram deletados.

SET NOCOUNT ON
GO

USE master
GO
 
CREATE DATABASE DBShrink
GO

USE DBShrink
GO
 
-- tabela de expurgo
CREATE TABLE DadosExpurgo
(
    ID		INT IDENTITY,
    Texto	CHAR(255)
)
GO


-- Gerando Massa de Dados
INSERT INTO DadosExpurgo (Texto)
VALUES ('Shrink - DBA Pira')
GO 5000

-- Tabela de Dados
CREATE TABLE Dados
(
    ID		INT IDENTITY,
    Texto	CHAR(200)
)
GO

-- Criando indice Clustered 
CREATE CLUSTERED INDEX idx_Dados ON Dados (ID);
GO
 
-- Gerando Massa de Dados
INSERT INTO Dados (Texto)
VALUES ('Shrink - DBA Pira')
GO 5430

Até este ponto, criamos duas tabelas e realizamos uma carga. Vamos analisar a fragmentação até o momento:

-- Retorna Fragmentação
SELECT
    [avg_fragmentation_in_percent]
FROM sys.dm_db_index_physical_stats (DB_ID (N'DBShrink'), OBJECT_ID (N'Dados'), 1, NULL, 'LIMITED')
GO

LG01

Aproximadamente 3% de fragmentação devido a operação de INSERT.

Abaixo, vamos simular um expurgo de dados, limpando uma das tabelas. Mas antes, por curiosidade, vamos avaliar o tamanho do banco de dados atual:

SP_HELPDB DBShrink

LG02

Agora sim, o TRUNCATE para limpar a tabela:

-- Realizando o Expurgo
TRUNCATE TABLE DadosExpurgo
GO

 

Vamos analisar o tamanho do banco após o TRUNCATE:

LG03

Mesmo realizando o TRUNCATE, o tamanho do banco continua o mesmo? Não era para ter diminuindo, já que executamos um TRUNCATE? A resposta é não! O SQL Server já alocou esse espaço em disco, pois teve a necessidade em determinado momento e não irá desfazer até que seja executado explicitamente essa liberação de disco. Essa execução de liberação é o Shrink. Pronto, está aí um dos motivos onde muitos executam essa rotina com o objetivo de diminuir o tamanho do banco de dados, mas na realidade os impactos negativos são muito mais evidentes e tendenciosos.

Ok, agora vamos executar o Shrink para devolver esse espaço para o sistema operacional:

-- Shrink
DBCC SHRINKDATABASE (DBShrink)
GO

Analisando o tamanho do banco novamente:

SP_HELPDB DBShrink

LG04

Observando o nível de fragmentação, podemos verificar que passou de 3% para 75%.

-- Retorna Fragmentação após o Shrink
SELECT
    [avg_fragmentation_in_percent]
FROM sys.dm_db_index_physical_stats (
    DB_ID (N'DBShrink'), OBJECT_ID (N'Dados'), 1, NULL, 'LIMITED');
GO

LG05

A fragmentação subiu exponencialmente. Se refletirmos sobre isso, vamos entender o problema e os impactos negativos que o Shrink pode gerar se executarmos em Produção. Essa simulação foi em ambiente controlado com duas tabelas, mas imagine esses números em grande escala com bancos de dados de 600, 800 GB, com milhares de tabelas e índices, o problema que podemos ter se executarmos esse comando sem consciência. O mito Paul Randal escreveu diversos artigos sobre essa rotina e ele comenta algo que acho muito interessante: “o Shrink existe e para determinados momentos e ambientes ele é muito útil e pode nos salvas de alguns problemas, porém, devemos saber quando, onde e como executá-lo e sempre de forma conscientes dos impactos que podemos gerar”.

Imagine um banco de dados em produção com 600 GB de dados (MDF), 150 GB de Log (LDF) e para uma determinada atividade, foi solicitado uma cópia deste banco para o ambiente de desenvolvimento. Normalmente, é recomendado e uma boa prática colocar todos os bancos de desenvolvimento em Recovery Model SIMPLE. Neste tipo de situação não vejo como uma má pratica executar o Shrink para diminuir o log, pois estamos em ambiente de desenvolvimento e na grande maioria das empresas temos hardware limitado para servidores dessa função.

Levando em consideração os aspectos observados, podemos concluir que o Shrink é uma feature interessante que tem suas particularidades. Cabe a nós, DBAs e/ou responsáveis pelo ambiente, analisar a real necessidade, levando em consideração os ricos envolvidos e sempre avaliando os impactos gerados nessa operação.

Bons estudos!