Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Come posso utilizzare il monitoraggio del cloud per identificare i problemi di latenza nell'acceleratore globale


Come posso utilizzare il monitoraggio del cloud per identificare i problemi di latenza nell'acceleratore globale


Per utilizzare il monitoraggio del cloud per identificare i problemi di latenza in AWS Global Accelerator, è possibile sfruttare le metriche di Amazon Cloudwatch e gli strumenti correlati come segue:

1. Monitora le metriche di CloudWatch per l'acceleratore globale

-AWS Global Accelerator pubblica automaticamente le metriche su Amazon Cloudwatch nella regione degli Stati Uniti West (Oregon) (US-WEST-2), quindi è necessario visualizzare le metriche specificamente in quella regione indipendentemente da dove viene distribuito l'acceleratore [2].

- Key CloudWatch Metrics su cui concentrarsi includono:
- Latenza: misura il tempo impiegato affinché il traffico venga instradato attraverso l'acceleratore globale ai tuoi endpoint.
- Endpoint sano/malsano conta: verificare se gli endpoint sono sani o causano ritardi.
- Volume del traffico e tassi di errore: correlare i picchi in latenza con modelli di traffico o errori [2].

- Queste metriche in tempo reale possono aiutarti a rilevare quando la latenza aumenta oltre le normali soglie, la segnalazione di potenziali problemi di rete o endpoint.

2. Imposta allarmi cloudwatch

- Creare allarmi sulle metriche di latenza per essere notificate immediatamente quando la latenza attraversa una soglia predefinita, consentendo una pronta indagine e bonifica [2].

3. Utilizzare i registri di flusso per analisi dettagliate del traffico

- Abilita i registri di flusso dell'acceleratore globali per acquisire informazioni dettagliate sull'immissione del traffico e sull'acceleratore [2].
- I registri di flusso forniscono approfondimenti sui dettagli a livello di pacchetto, che possono aiutare a diagnosticare i problemi di raggiungibilità o di routing che potrebbero causare latenza.
- Si noti che i registri di flusso richiedono l'installazione e l'archiviazione in Amazon S3.

4. Analizzare il tempo di andata e ritorno (RTT) e la perdita di pacchetti

- Utilizzare strumenti diagnostici di rete come ping e traceroute dalle posizioni dei client agli endpoint dell'acceleratore globale per misurare la perdita di RTT e pacchetti [1].
- L'elevata perdita di RTT o pacchetti può indicare la congestione della rete o le inefficienze del routing che contribuiscono alla latenza.
-AWS consiglia di utilizzare l'eco TCP con Traceroute per bypassare i filtri del firewall comuni e ottenere misurazioni accurate di latenza hop-by-hop [1].
- Raccogli periodicamente misurazioni (ad esempio, ogni 5 minuti per un'ora) per osservare le tendenze di latenza e identificare segmenti di rete problematici.

5. Correlare la salute e la latenza dell'endpoint

- L'acceleratore globale monitora continuamente l'Endpoint Health e reinserisce il traffico lontano da endpoint malsani entro circa un minuto [8].
- Se i problemi di latenza coincidono con il degrado della salute degli endpoint, indagare sui servizi di back -end o i bilanciatori del carico per i colli di bottiglia delle prestazioni.

6. Usa AWS CloudTrail per l'auditing delle attività API

- CloudTrail Logs Chiamate API Accelerator globali, che possono aiutare a correlare le modifiche alla configurazione o le distribuzioni con i picchi di latenza [2].

Riepilogo

Combinando le metriche e gli allarmi di latenza di CloudWatch, i registri di flusso per i dettagli del traffico e le misurazioni della rete come RTT e Traceroute, è possibile identificare e diagnosticare efficacemente i problemi di latenza nell'acceleratore globale AWS. Il monitoraggio della salute degli endpoint e correlare con i modelli di traffico aiuta ulteriormente a individuare le cause della radice, consentendo di ottimizzare il routing e migliorare le prestazioni dell'applicazione a livello globale [1] [2] [8] [9].

Citazioni:
[1] https://aws.amazon.com/blogs/networking-and-content-desivery/measuring-aws-global-ackcelerator-performance-and-analyzing-results/
[2] https://docs.aws.amazon.com/global-accelerator/latest/dg/monitoring-global-ackcelerator.html
[3] https://aws.amazon.com/global-accelerator/features/
[4] https://cloudonaut.io/review-aws-global-accelerator-latency-multi-region-disaster-recovery/
[5] https://www.thholeyes.com/blog/aws-optimizes-performance-global-accelerator
[6] https://docs.aws.amazon.com/global-accelerator/latest/dg/introduction-how-it-works.html
[7] https://cloud.google.com/spanner/docs/latency-metrics
[8] https://digitalcloud.training/aws-global-ackcelerator/
[9] https://cloudchipr.com/blog/aws-global-accelerator