Pular para o conteúdo
Monitoramento8 min de leitura

7 alertas essenciais que toda loja virtual deveria ter

Você não precisa de 50 alertas — precisa dos 7 certos. Esta é a lista mínima que toda loja virtual deveria ter, do uptime básico ao alerta de pedidos travados e quebra de schema.org.

Terminal de código rodando em monitor escuro
Alerta = decisão. Se a resposta é 'depende, vou investigar', não é alerta — é dashboard. Sem ação clara, vira notificação que ninguém atende.Unsplash
O que você vai aprender
  • O princípio "alerta = decisão" que evita criar 50 ruídos.
  • Os 7 alertas que cobrem 80% dos incidentes que afetam vendas em e-commerce.
  • Em qual canal alertar conforme severidade (telefone vs Slack vs e-mail diário).
  • Como evitar fadiga de alerta: retries, throttle, baseline e severidade calibrada.

Quanto mais alertas, melhor? Errado. Alerta demais vira ruído — equipe desliga notificação e o que importa passa batido. Em loja virtual, há um conjunto pequeno de sinais que cobrem 80% dos incidentes que afetam vendas. Essa é a lista mínima — 7 alertas que toda loja deveria ter, independente do tamanho.

26%
de fadiga de alerta (alert fatigue) reportada por equipes de SRE em pesquisa do PagerDuty
PagerDuty State of On-Call
3-5%
é a taxa máxima aceitável de falso positivo antes de a equipe começar a ignorar alertas
Google SRE Book, cap. "Monitoring"
68%
das equipes ainda descobrem incidentes pelo cliente, não pelo monitoramento
PagerDuty State of Digital Operations
~75%
de redução do MTTR (Mean Time to Resolve) quando há plano de resposta escrito e ensaiado
Atlassian Incident Management Report
Um alerta deve representar uma condição que requer ação humana. Se não há ação possível, não é um alerta — é um log.— Rob Ewaschuk, "My Philosophy on Alerting" (Google SRE Book)

Princípio orientador: alerta = decisão

Antes de configurar qualquer alerta, responda: "o que eu vou fazer quando ele disparar?". Se a resposta é "depende, vou investigar", não é um alerta — é um dashboard. Alerta tem que ter ação clara e dono claro. Sem isso, vira notificação que ninguém atende.[1]

1. Uptime da home (essencial)

Detecta o caso óbvio: a loja parou de responder. Frequência ideal: a cada 1–2 minutos. Navegação real com Chromium é mais confiável que ping — porque um servidor pode responder 200 e ainda estar quebrado (JavaScript fatal, página em branco).

Ação ao disparar: acionar quem cuida da infra. Plano de incidente deve estar a um clique de distância.

2. Uptime do checkout (essencial)

Home pode estar no ar e checkout quebrado — é até comum, porque checkout depende de cálculo de frete, gateway, antifraude. Configure um teste sintético que percorre:

  1. Adicionar produto ao carrinho
  2. Aplicar CEP e ver frete
  3. Chegar até a tela final de pagamento (sem concluir)

Se algum desses passos falhar, é alerta crítico imediato. Custo de venda perdida em checkout quebrado é muito maior que home fora — home fora você descobre em segundos, checkout quebrado leva horas se ninguém testa.

3. Validade do certificado SSL (essencial)

Certificado vencido derruba a loja inteira de uma vez — todo navegador exibe aviso e nenhum cliente passa. Comum em quem usa Let's Encrypt sem renovação automática ou certificados pagos com renovação manual.

Configure alerta para disparar 30 dias antes da expiração e novamente em 7 dias. Verificadores como inspetor de cabeçalhos HTTP já mostram a data de validade — basta automatizar.

4. Pedidos travados

Pedidos parados em pending_payment por mais de 2 horas ou em processing por mais de 24h. Quase sempre é integração quebrada em silêncio — gateway, ERP, antifraude. Veja como detectar pedidos travados em Magento 2.

Ação ao disparar: verificar logs do gateway, status do consumer da fila e healthcheck da integração com ERP.

5. SKUs visíveis sem estoque

Produto aparece para o cliente e ele não consegue comprar — ou pior, consegue finalizar e depois recebe e-mail de cancelamento. Esse alerta cruza o que está publicado com o que está disponível, em janela móvel.

Crítico para quem trabalha com estoque sincronizado de marketplaces ou ERP. Pico de venda + sincronização lenta = oversell garantido. Trate diferente conforme a margem: em produto caro, alerta amarelo a partir de 5 SKUs; em produto barato, só vermelho.

6. Quebra de Schema.org / dados estruturados

Snippet rico no Google é vantagem competitiva real em e-commerce — preço, avaliação, estoque aparecem diretamente no resultado de busca. Quando uma atualização de template ou módulo quebra o Schema.org, o snippet some sem aviso. A queda de CTR pode levar semanas para virar uma queda perceptível no faturamento.[2]

Configure validação periódica das páginas mais importantes: validador de dados estruturados + alerta quando JSON-LD inválido aparecer.

7. Performance que degradou

LCP, INP ou TTFB acima do limite por mais de 2 ciclos consecutivos. Não é alerta urgente — é alerta de manhã, quando dá tempo de investigar com calma. Configure com baseline próprio (cada loja tem o seu) e tolerância de variação (10%).

Veja a explicação completa em Core Web Vitals para loja virtual.

Tela de smartphone com notificação push exibida
E-mail não é canal de alerta crítico — Discord, Slack ou Telegram funcionam porque a equipe já está lá. E-mail vira backup pro que não corre.Unsplash

Em qual canal alertar

SeveridadeCanal recomendadoTempo de resposta esperado
Crítico (uptime, certificado)Telefone / PagerDuty / Discord com mention< 10 min
Alto (pedidos travados, checkout)Slack/Discord com canal dedicado< 30 min
Médio (performance, estoque)Slack/Discord, sem mention< 4 h
Baixo (SEO, schema)E-mail diário consolidado24 h

Como evitar virar ruído

  • Confirmar antes de alertar. Use retry: 2–3 tentativas com 30s entre elas antes de notificar humano. Falso positivo único não dispara alerta.
  • Throttle por canal. Se 5 testes falham em 1 minuto, mande 1 alerta consolidado em vez de 5 mensagens. A Especialista Loja Virtual faz isso por padrão.
  • Threshold com baseline. "> 3s de LCP" é arbitrário. "> 20% do baseline da semana passada" é relativo e some quando o problema é só sazonalidade.
  • Severidade calibrada. Nem todo alerta merece acordar alguém às 3h. Defina o que é "acordar alguém" e o que pode esperar a manhã.
📌 Regra de ouro: se um alerta dispara mais que 1× por semana sem ser ação real, está calibrado errado. Aumente threshold ou ajuste para baseline antes que a equipe pare de olhar.

Próximos passos práticos

  1. Liste hoje quais desses 7 você tem.
  2. Comece pelos 3 essenciais (1, 2, 3) — cobre 70% dos casos.
  3. Adicione os de pedidos e estoque (4, 5) — específicos de e-commerce, alto impacto em faturamento.
  4. Por último, os "de longo prazo" (6, 7) — não evitam queda imediata, mas evitam erosão silenciosa.

Para configurar tudo de uma vez sem montar infraestrutura própria, veja os planos da Especialista Loja Virtual — todos os 7 já vêm prontos, e você só ajusta os limites para sua operação.

Referências

  1. Rob Ewaschuk. My Philosophy on Alerting, em "Site Reliability Engineering" (Google/O'Reilly). sre.google/sre-book/monitoring-distributed-systems
  2. Google Search Central. Rich Results — Product structured data. developers.google.com/search/docs/appearance/structured-data/product
  3. Atlassian. Incident Management Handbook. atlassian.com/incident-management
  4. PagerDuty. State of Digital Operations & State of On-Call, relatórios anuais. pagerduty.com/resources
  5. Beyer et al. Site Reliability Engineering — How Google Runs Production Systems. O'Reilly, 2016, cap. 6 (Monitoring Distributed Systems).

Perguntas frequentes

Por onde devo começar se ainda não tenho monitoramento nenhum?
Comece pelos três essenciais: uptime da home, uptime do checkout e validade do certificado SSL. Esses três cobrem 70% dos incidentes que afetam vendas e custam baratíssimo para configurar.
Discord, Slack ou e-mail? Qual canal escolher?
Para equipe técnica, Discord ou Slack — alertas devem chegar onde a equipe já está. E-mail funciona como backup e para alertas não-urgentes (relatório diário, SEO).
Quantos alertas falsos positivos são aceitáveis?
Menos de 5% do total. Mais que isso e a equipe começa a ignorar — vira o "boy who cried wolf". Se está com muito falso positivo, aumente a frequência de retries ou o limiar antes de disparar.

Monitore tudo isso automaticamente

A Especialista Loja Virtual roda navegação real no seu site a cada poucos minutos, alerta no Discord, Slack ou e-mail e mostra screenshot do incidente. Comece grátis.