Banco de Dados

8 mai, 2019

Desempenho do processador x desempenho do SQL Server – Parte 02

Publicidade

Olá, caro leitor!

Esta é mais uma série de artigos, e o assunto da vez é o desempenho do processador. No artigo anterior vimos alguns conceitos básicos sobre velocidade da CPU.

Agora vamos aplicar um pouco desses conceitos no SQL Server e observar alguns efeitos na prática.

Revisão:

  • Clock: dispositivo da CPU que liga e desliga em uma certa frequência (clock tick)
  • 1 Hertz: uma vez por segundo
  • 1 KHz: mil vezes por segundo
  • 1 MHz: um milhão de vezes por segundo
  • 1 GHz: um bilhão de vezes por segundo

Cada instrução leva x clock ticks. Quanto mais rápido um processador, mais rapidamente as instruções executam.

No caso de código SQL, uma infinidade de instruções são executadas, não somente para acessar os dados e fazer alguma operação em cima deles, mas também para:

  • Verificar locks/latches
  • Checar permissões
  • Acionar disco, rede

São centenas de milhares de instruções sendo executadas por uma simples consulta SQL. Isso significa que com qualquer alteração na velocidade da CPU, a query poderá ser impactada (para melhor, ou para pior).

Vamos fazer um simples exercício, baseado numa query simples como esta:

SELECT SUM(Valor) FROM Pedidos

Imagine que a query acima gaste 10 instruções, e para simplificar mais ainda, imagine que cada instrução desta gaste apenas 1 tick do nosso clock. Imagine que essa query execute num incrível processador de 100 Hertz (isso mesmo, cem ticks por segundo).

Primeiro, calcule o tempo de um tick:

  • 1 tick = 1000ms/100
  • 10ms: cada tick nesse nosso incrível processador gasta apenas 10 ms!

Se a nossa query gasta 10 ticks e cada tick tem 10ms, então ela vai gastar 100 ms de CPU (10ms * 10 ticks = 100 ms).

Nota muito importante: aqui é só uma simulação de um gasto somente de CPU. Não estou colocando outras variáveis, como disco, memória, rede, etc.

Exemplo de uma query que gasta um número X de instruções. O tempo total de CPU vai sempre depender da velocidade do processador.

Quando otimizamos essa query criando um índice ou adicionando mais filtros, estamos reduzindo o número de instruções (ou escolhendo instruções que gastam menos tempo). Por isso, o tempo de CPU diminui.

Por exemplo, imagine que após criar um índice, causando a leitura de menos dados, a query execute com apenas quatro instruções. O tempo no processador de mesma velocidade será de 40ms (10ms * 4 ticks).

Simulando a otimização da query. Por exemplo, saindo de um clustered index scan, para um index scan, poderia causar a execução de menos instruções, devido a um menor número de páginas, menos colunas, etc. Tudo isso impacta na quantidade de instruções no final. Simples, não?

Velocidade do processador na prática

Vamos fazer o seguinte: vamos brincar com nosso processador e observar como a velocidade do mesmo impacta em nossas consultas.

Os processadores mais modernos permitem alterar sua velocidade dinamicamente para poupar energia. Um clock que opera a 2.5 GHz gasta mais energia do que o mesmo clock operando a somente 100 MHz.

Geralmente, os sistemas operacionais nos fornecem várias opções de controlar o gerenciamento de energia do processador.

Vamos criar um simples banco de dados com uma tabela grande e alguma quantidade considerável de registros:

-- Cria um banco de testes...
CREATE DATABASE CpuSpeed;
-- Usando nosso banco de testes...
USE CpuSpeed;
-- Cria uma tabela simples...
CREATE TABLE Pedidos(valor bigint);
-- Insere alguns valores aleatorios. pode demorar um pouco...
INSERT INTO Pedidos SELECT abs(checksum(newid())) FROM sys.objects o1,sys.objects o2,sys.objects o3;

Este código simplesmente cria um banco novo, uma tabela neste banco e insere alguns registros aleatórios. Eu faço CROSS JOINs entre várias instâncias da view “sys.objects” apenas para gerar um grande número de registros. O abs(CHECKSUM(newid())) gera um número aleatório para cada linha.

Antes de executar alguma query, vamos garantir que nosso computador irá operar no seu potencial máximo:

Procure as opções de energia do seu computador. Você pode digitar powercfg.cpl no menu iniciar. Será exibida uma tela semelhante a esta:

Clique em “alterar configurações do plano” no respectivo plano que está marcando com a bolinha preta (no meu caso, o plano se chama “Dell”).

Na próxima tela, clique em “Alterar configurações de energia avançadas”:

Na janela que abrir, procure por “Gerenciamento de energia do processador”:

Altere o valor de mínimo para 100. Certifique-se que o máximo esteja em 100%. Caso contrário, ajuste também. Se você está usando notebook, mas ele está usando a bateria como fonte de energia, então faça as alterações na opção “Na Bateria”.

Se quiser garantir, pode alterar a configuração tanto para bateria, quanto para tomada. Memorize os valores que estavam antes para voltar a configuração original depois, tudo bem?

Pronto, clique em Aplicar, e em seguida em OK.

Agora observe no Gerenciador de Tarefas (caso utilize um gerenciador de tarefas de uma versão anterior ao 2012 do Windows, você pode baixar a ferramenta CPU-Z):

A velocidade deverá ficar sempre maior ou igual ao “velocidade base”.

O que essa opção fez? Nós apenas solicitamos que o nosso processador sempre trabalhe no máximo de velocidade possível. Com isso, mais energia será gasta, porém, nosso processador nunca irá baixar a velocidade.

No meu caso, meu processador consegue trabalhar em 3.1 GHz (3 bilhões de ticks por segundo).

Pronto, acabamos de deixar o processador em seu desempenho máximo. Vamos rodar uma consulta e observar o tempo de CPU. Utilize o seguinte comando para obter o tempo de CPU:

SET STATISTICS TIME ON

Agora execute a seguinte query:

-- Executando uma query com maxdop 1 para garantir que somente uma CPU será usada
-- O recompile é pra forçar um novo plano de execução sempre (e observarmos o tempo de CPU gasto na compilação também)
select avg(valor) from Pedidos option(maxdop 1, recompile)

Na aba “Messages” observe o tempo da execução. Se você acabou de reiniciar a instância, execute novamente para garantir que faremos a leitura somente de dados em memória. Você está interessado no valor da informação “CPU Time”:

O primeiro grupo de informação é referente ao tempo de compilação/recompilação da query. Ele rodou abaixo de 1ms, e por isso exibe zero.

Já o segundo grupo (este nos interessa) nos diz quanto de CPU a query gastou através da informação “CPU time”. Note que o valor é de 266ms.

Agora vamos reduzir o máximo do nosso processador pela metade e observar o que acontece com nossa query. Acesse novamente o powercfg.cpl e repita o procedimento:

  • Escolha alterar configuração do plano atual
  • Depois vá em alterar configurações de energia avançadas
  • Vá em gerenciamento de energia do processador
  • Coloque o mínimo e o máximo em 50% (lembre-se, se não estiver conectado na tomada, altere o da bateria).

Confirme no Gerenciador de tarefas, ou no CPU-Z, que a velocidade do clock diminuiu.

Diminuindo o clock do processador para 50% da sua velocidade. Não espere nunca uma redução de exatos 50%. Poderão sofrer algumas pequenas variações – isso depende do processador, do sistema operacional, etc.
Note que a velocidade do clock do meu processador caiu para 1.29 Ghz

Perceba que agora minha CPU estará rodando com cerca de metade da força. Como será que isso vai impactar no tempo da minha query?

Minha query saiu de 266ms para 594ms – um aumento de 123% no consumo de CPU e tempo da query.

Muito interessante como a velocidade da CPU pode afetar o tempo de execução das consultas. No próximo artigo vou explicar melhor o que aconteceu e falaremos de outras coisas mais!

Até lá!