Como calcular a performance de um grupo de discos? RAID, IOPS e throughput explicados

Escolher discos para um servidor ou storage não é só questão de capacidade — é sobre entender como os discos trabalham juntos e qual desempenho real você pode esperar do conjunto. Calcular a performance de um grupo de discos envolve compreender conceitos como RAID, IOPS, throughput e latência, e como cada configuração impacta velocidade de leitura, escrita e tolerância a falhas.

Neste guia você vai aprender como calcular a performance de grupos de discos nas principais configurações RAID, entender as métricas fundamentais e tomar decisões informadas para projetos de infraestrutura.

Performance de discos em 30 segundos (resumo rápido)

  • Métricas principais: IOPS (operações de I/O por segundo), throughput (MB/s) e latência (ms) — cada uma importa em workloads diferentes.
  • RAID define o trade-off: entre capacidade utilizável, velocidade de leitura/escrita e redundância.
  • Regra geral: mais discos em paralelo = mais IOPS e throughput de leitura; tipo RAID define o fator de penalidade na escrita.
  • Tipo de disco importa: HDDs são lentos mas baratos por GB; SSDs SATA são rápidos; NVMe PCIe são de 5 a 20x mais rápidos que SATA.

Métricas essenciais de performance de disco

IOPS (Input/Output Operations Per Second)

Mede quantas operações de leitura ou escrita o storage pode realizar por segundo. É a métrica mais importante para bancos de dados, VMs e aplicações transacionais onde há muitas operações pequenas e aleatórias. Um HDD típico entrega 80-150 IOPS; um SSD SATA chega a 90.000 IOPS; um NVMe de alto desempenho pode superar 1 milhão de IOPS.

Throughput (MB/s)

Mede o volume de dados transferidos por segundo. É a métrica mais relevante para operações sequenciais grandes — backup, transferência de arquivos, streaming de vídeo, big data. Um HDD típico entrega 100-250 MB/s sequencial; um NVMe Gen 4 pode superar 7.000 MB/s.

Latência (ms / µs)

Tempo de resposta para uma operação de I/O. HDDs têm latência de 5-15ms (tempo de seek mecânico). SSDs SATA ficam em 0,1-0,3ms. NVMe chega a 0,02-0,05ms. Aplicações sensíveis à latência (bancos de dados OLTP, aplicações real-time) se beneficiam enormemente do NVMe.

RAID: como grupos de discos trabalham juntos

RAID (Redundant Array of Independent Disks) é a tecnologia que combina múltiplos discos em um único volume lógico, com diferentes trade-offs entre performance, capacidade e redundância.

RAID 0 — Striping (velocidade máxima, sem redundância)

Os dados são distribuídos em fatias (stripes) por todos os discos simultaneamente. Resultado: performance de leitura e escrita proporcional ao número de discos. Sem tolerância a falhas — se um disco falhar, todos os dados são perdidos.

  • Capacidade: N × capacidade de cada disco
  • IOPS leitura: N × IOPS de um disco
  • IOPS escrita: N × IOPS de um disco
  • Uso: edição de vídeo temporária, caches de alta velocidade — onde performance importa mais que dados

RAID 1 — Mirroring (redundância máxima)

Cada disco tem uma cópia idêntica em outro disco. A leitura pode ser paralelizada (até 2x); a escrita é limitada ao desempenho de um único disco.

  • Capacidade utilizável: N/2 × capacidade de um disco
  • IOPS leitura: N × IOPS (leitura distribuída entre espelhos)
  • IOPS escrita: IOPS de um único disco (escrita simultânea nos espelhos)
  • Uso: sistemas operacionais de servidores, boot volumes, dados críticos

RAID 5 — Striping com paridade distribuída

Os dados são distribuídos entre os discos com um bloco de paridade por stripe, rotacionado entre os discos. Permite recuperar dados se um disco falhar. Mínimo de 3 discos.

  • Capacidade utilizável: (N-1) × capacidade de um disco
  • IOPS leitura: (N-1) × IOPS (excelente)
  • IOPS escrita: IOPS de um disco / 4 (penalidade de paridade — cada escrita exige ler dados e paridade antiga, calcular nova paridade, escrever dados e paridade)
  • Uso: NAS de escritório, armazenamento de arquivos de acesso frequente
RAID 5 com HDDs grandes pode ser perigoso: o tempo de rebuild de um RAID 5 com HDDs de 8TB+ pode levar dias — durante os quais a leitura intensiva para reconstrução pode causar falha de um segundo disco. Para HDDs grandes, o RAID 6 é mais seguro.

RAID 6 — Striping com dupla paridade

Similar ao RAID 5, mas com dois blocos de paridade — suporta falha de até dois discos simultaneamente. Mínimo de 4 discos.

  • Capacidade utilizável: (N-2) × capacidade de um disco
  • IOPS leitura: (N-2) × IOPS
  • IOPS escrita: ainda mais penalizado que RAID 5 (dupla paridade)
  • Uso: armazenamento crítico com HDDs grandes, onde dois discos podem falhar durante um rebuild

RAID 10 — Mirroring + Striping (o favorito para produção)

Combina RAID 1 (espelhamento) com RAID 0 (striping). Mínimo de 4 discos. Cada par é espelhado e os pares são striped entre si. Excelente para bancos de dados e aplicações de alto I/O.

  • Capacidade utilizável: N/2 × capacidade de um disco
  • IOPS leitura: N × IOPS (leitura de qualquer espelho)
  • IOPS escrita: (N/2) × IOPS (escrita simultânea nos pares espelhados)
  • Uso: bancos de dados MySQL/PostgreSQL, e-commerce, aplicações transacionais

Tabela comparativa das configurações RAID

RAIDCapacidadeLeituraEscritaTolerância a falhasMín. discos
RAID 0100%N× mais rápidoN× mais rápidoNenhuma2
RAID 150%N× mais rápido1× (penalizado)N-1 discos2
RAID 5(N-1)/N(N-1)× mais rápido~1/4 de um disco1 disco3
RAID 6(N-2)/N(N-2)× mais rápido~1/6 de um disco2 discos4
RAID 1050%N× mais rápido(N/2)× mais rápido1 por par4

Exemplo prático de cálculo

Você tem 6 SSDs SATA com 500 MB/s de leitura sequencial e 400 MB/s de escrita cada. Qual o desempenho esperado em RAID 10?

  • Capacidade utilizável: 6/2 × capacidade individual = 3 × capacidade
  • Throughput de leitura sequencial: 6 × 500 MB/s = 3.000 MB/s (leitura distribuída entre todos os espelhos)
  • Throughput de escrita sequencial: (6/2) × 400 MB/s = 3 × 400 = 1.200 MB/s
  • Tolerância: sobrevive à falha de um disco em cada par espelhado
Na prática, os números reais são menores: overhead do controlador RAID, latência de bus, limitações do sistema de arquivos e workload misto (leitura + escrita simultâneos) reduzem o desempenho teórico. Planeje com 60-80% do valor teórico como estimativa conservadora para workloads mistos.

Perguntas frequentes sobre performance de grupos de discos

RAID substitui o backup?

Absolutamente não. RAID protege contra falha de hardware de disco — ele não protege contra exclusão acidental, ransomware, corrupção lógica ou falha do controlador RAID. Backup é obrigatório independentemente do RAID utilizado. A regra 3-2-1 (3 cópias, 2 mídias diferentes, 1 offsite) continua válida.

RAID por hardware ou software (mdadm)?

RAID por hardware (controladora dedicada como LSI/Broadcom ou HPE Smart Array) oferece melhor desempenho e tem cache com bateria para operações de escrita. RAID por software (mdadm no Linux) é gratuito, flexível e mais fácil de recuperar em caso de falha da controladora. Para produção crítica, hardware RAID com cache é preferível. Para servidores menores ou NAS, o mdadm é uma solução excelente e confiável.

Qual RAID é melhor para banco de dados?

RAID 10 é a escolha padrão para bancos de dados relacionais (MySQL, PostgreSQL, Oracle) porque oferece excelente desempenho tanto em leitura quanto em escrita aleatória, com boa tolerância a falhas. Em ambientes com SSDs NVMe de alta performance, às vezes usa-se RAID 1 ou RAID 10 com um número menor de discos de ponta em vez de muitos discos medianos.

Como o SSD muda o cálculo de RAID?

Com SSDs (especialmente NVMe), a penalidade de escrita do RAID 5/6 se torna menos crítica porque o disco é tão rápido que mesmo com a penalidade ainda entrega throughput excelente. Além disso, o risco do “RAID 5 write hole” diminui com SSDs que têm capacitores de proteção. Muitos ambientes modernos com NVMe usam RAID 1 ou RAID 10 simples em vez de RAID 5/6.

Conclusão

Calcular a performance de um grupo de discos é combinar entendimento das métricas (IOPS, throughput, latência) com o comportamento de cada nível de RAID. Não existe configuração universalmente melhor — a escolha depende do workload, do budget e do nível de redundância necessário. Para workloads transacionais, RAID 10 é o padrão ouro. Para armazenamento de arquivos, RAID 5 ou 6 maximiza capacidade. Para caches temporárias de alta performance, RAID 0 com SSDs entrega velocidade máxima.

Explore mais conteúdos sobre infraestrutura e tecnologia no Atraca para aprofundar seu conhecimento em storage e hardware.