O AWS Global Accelerator realiza failover instantâneo por meio de monitoramento contínuo de saúde e roteamento de tráfego inteligente para manter alta disponibilidade e baixa latência para aplicativos implantados em várias regiões da AWS ou pontos de extremidade.
Os principais aspectos de como o failover instantâneo funciona no acelerador global:
- Verificações de saúde: o acelerador global monitora continuamente a saúde de todos os pontos de extremidade do aplicativo configurados usando verificações de saúde TCP, HTTP ou HTTPS. Se um endpoint se tornar prejudicial, é imediatamente marcado como tal [3] [5].
- Redirecionamento de tráfego instantâneo: Ao detectar um endpoint não saudável, o acelerador global interrompe instantaneamente o roteamento de novas conexões para esse ponto final e redireciona o tráfego para o próximo melhor ponto de extremidade saudável, que pode estar na mesma ou em uma região diferente. Esse failover ocorre em cerca de 30 segundos a partir da detecção da falha [2] [9].
- Lógica de roteamento: o serviço direciona o tráfego do cliente para o ponto final saudável mais próximo, com base na latência da rede e na saúde do endpoint. Se nenhum endpoint saudável com um peso positivo de tráfego estiver disponível, o Global Accelerator direcionará o tráfego para um ponto de extremidade aleatório no grupo de terminais mais próximo do cliente, efetivamente * falhando aberto * para manter a conectividade [2].
- Manuseio de conexão: o acelerador global encerra as conexões TCP do cliente nos locais da AWS Edge e estabelece novas conexões TCP para pontos de extremidade saudáveis quase simultaneamente. No entanto, as conexões ativas existentes com um endpoint prejudicial não são quebradas imediatamente; Eles continuam até fechados ou cronometrados, após o que novas conexões são roteadas para pontos de extremidade saudáveis [2] [3].
- Dial e pesos de tráfego: você pode configurar pesos de tráfego e mostradores de tráfego em grupos de terminais para controlar a distribuição do tráfego. O failover respeita essas configurações, tentando direcionar o tráfego para longe dos pontos de extremidade zero peso. Se todos os pontos de extremidade saudáveis tiverem peso zero, o mecanismo de failover recorre ao roteamento para o grupo terminal mais próximo, independentemente do peso [2].
-Backbone da rede global: ao rotear o tráfego sobre a rede global da AWS, o Global Accelerator garante caminhos sem baixa latência e congestionamento, o que aumenta a velocidade e a confiabilidade do failover [2].
- Endereços IP estáticos: o Global Accelerator fornece dois endereços IPv4 estáticos que servem como pontos de entrada fixos para o tráfego do cliente. Esses IPs permanecem constantes mesmo quando ocorre o failover, eliminando atrasos no cache de DNS e permitindo failover quase instantâneo sem alterações do lado do cliente [4] [7].
- Velocidade de failover: embora comercializada como "instante", o failover normalmente é concluído em menos de um minuto, com cerca de 30 segundos necessários para detectar e redirecionar novas conexões para pontos de extremidade saudáveis. Isso é mais rápido que os mecanismos de failover baseados em DNS, que podem ser retardados pelo cache de DNS [9].
Em resumo, o AWS Global Accelerator alcança failover instantâneo, monitorando continuamente a saúde do endpoint, roteando dinamicamente as novas conexões de clientes para os pontos finais saudáveis mais próximos por meio de endereços IP estáticos e alavancando a rede global da AWS para obter o desempenho ideal. Esse design minimiza o tempo de inatividade e fornece failover sem costura entre regiões ou zonas de disponibilidade sem a necessidade de atualizações de DNS do lado do cliente ou intervenção manual [2] [3] [5] [7] [9].
Citações:
[1] https://docs.aws.amazon.com/global-accelerator/latest/dg/about-endpoints-endpoint-weights.unhealthy-ndpoints.html
[2] https://docs.aws.amazon.com/global-accelerator/latest/dg/introduction-how-it-works.html
[3] https://tutorialsdojo.com/aws-global-accelerator/
[4] https://aws.amazon.com/blogs/networking-and-content-delivery/maximising-application-resilience-with-aws-global-accellerator/
[5] https://cloudvisor.co/aws-guides/aws-global-accelerator/
[6] https://aws.amazon.com/blogs/networking-and-content-delivery/creating-disaster-recovery mecanismos-using-amazon-don--53/
[7] https://aws.amazon.com/global-accelerator/features/
[8] https://stackoverflow.com/questions/62638339/how-to-improve-dailover-peed-for-aws-global-celerator-or-route53-libency-rout
[9] https://aws.amazon.com/global-accelerator/faqs/