Para usar o monitoramento em nuvem para identificar problemas de latência no AWS Global Accelerator, você pode aproveitar as métricas do Amazon CloudWatch e as ferramentas relacionadas da seguinte forma:
1. Monitore as métricas do CloudWatch para acelerador global
-O AWS Global Acelerator publica automaticamente métricas para a Amazon CloudWatch na região oeste dos EUA (Oregon) (US-West-2); portanto, você precisa visualizar métricas especificamente nessa região, independentemente de onde seu acelerador está implantado [2].
- As métricas de Key CloudWatch para se concentrar incluem:
- Latência: mede o tempo necessário para que o tráfego seja encaminhado através do acelerador global para seus pontos de extremidade.
- Contagem de terminais saudáveis/não saudáveis: Para verificar se os pontos de extremidade são saudáveis ou causam atrasos.
- Taxas de volume de tráfego e erro: correlacionar picos na latência com padrões ou erros de tráfego [2].
- Essas métricas em tempo real podem ajudá-lo a detectar quando a latência aumenta além dos limiares normais, sinalizando possíveis problemas de rede ou terminal.
2. Configure os alarmes do CloudWatch
- Crie alarmes nas métricas de latência para serem notificadas imediatamente quando a latência ultrapassar um limite predefinido, permitindo uma investigação e remediação rápidas [2].
3. Use logs de fluxo para análise de tráfego detalhada
- Ativar logs de fluxo do acelerador global para capturar informações detalhadas sobre o tráfego que entra e deixa o acelerador [2].
- Os logs de fluxo fornecem informações sobre detalhes no nível do pacote, o que pode ajudar a diagnosticar problemas de acessibilidade ou roteamento que podem causar latência.
- Observe que os logs de fluxo requerem configuração e armazenamento na Amazon S3.
4. Analise o tempo de ida e volta (RTT) e a perda de pacotes
- Use ferramentas de diagnóstico de rede, como ping e traceroute, desde os locais dos clientes até os pontos de extremidade do acelerador global para medir a RTT e a perda de pacotes [1].
- A alta perda de RTT ou pacotes pode indicar ineficiências de congestionamento ou roteamento de rede que contribuem para a latência.
-A AWS recomenda o uso do ECHO TCP com o Traceroute para ignorar os filtros comuns do firewall e obter medições precisas de latência de salto por hop [1].
- Colete medições periodicamente (por exemplo, a cada 5 minutos acima de uma hora) para observar as tendências de latência e identificar segmentos de rede problemáticos.
5. Correlacionar a saúde e latência do ponto final
- O acelerador global monitora continuamente o endpoint Health e redireciona o tráfego dos pontos de extremidade não saudáveis em cerca de um minuto [8].
- Se os problemas de latência coincidem com a degradação da saúde do endpoint, investigue os serviços de back -end ou os balanceadores de carga para gargalos de desempenho.
6. Use aws CloudTrail para auditoria de atividades da API
- CloudTrail Logs Global Acelerator API Chamadas, que podem ajudar a correlacionar alterações de configuração ou implantações com picos de latência [2].
Resumo
Ao combinar métricas e alarmes de latência no CloudWatch, logs de fluxo para detalhes do tráfego e medições de rede como RTT e Traceroute, você pode efetivamente identificar e diagnosticar problemas de latência no AWS Global Acelerator. O monitoramento do ponto final da saúde e correlacionamento com os padrões de tráfego ajuda ainda mais a identificar as causas das raiz, permitindo otimizar o roteamento e melhorar o desempenho do aplicativo globalmente [1] [2] [8] [9].
Citações:
[1] https://aws.amazon.com/blogs/networking-and-content-delivery/measuring-aws-global-accelerator-perance-and-analyzing-results/
[2] https://docs.aws.amazon.com/global-accelerator/latest/dg/monitoring-global-accelerator.html
[3] https://aws.amazon.com/global-accelerator/features/
[4] https://cloudonaut.io/review-aws-global-accelerator-latency-multi-region-disaster-recovery/
[5] https://www.theyeyes.com/blog/aws-optimeses-permance-global-celerator
[6] https://docs.aws.amazon.com/global-accelerator/latest/dg/introduction-how-it-works.html
[7] https://cloud.google.com/spanner/docs/latncy-metrics
[8] https://digitalcloud.training/aws-global-accelerator/
[9] https://cloudchipr.com/blog/aws-global-accelerator