Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon Quali metriche dovrei monitorare per diagnosticare i problemi di latenza con l'acceleratore globale


Quali metriche dovrei monitorare per diagnosticare i problemi di latenza con l'acceleratore globale


Per diagnosticare i problemi di latenza con AWS Global Accelerator, è necessario monitorare diverse metriche chiave e utilizzare gli strumenti di monitoraggio AWS per ottenere approfondimenti dettagliati:

Metriche chiave per monitorare

1. Tempo di andata e ritorno (RTT) / latenza
RTT misura il tempo impiegato per un pacchetto per viaggiare dal client all'endpoint e ritorno. È la metrica primaria per valutare la latenza della rete ed è influenzata dalla distanza fisica e dalle condizioni di rete. Il monitoraggio di RTT aiuta a identificare dove viene introdotta la latenza nel percorso [1].

2. Throughput
Ciò misura la quantità di dati o il numero di pacchetti consegnati in un periodo di tempo. Il throughput basso può indicare la congestione della rete o i problemi di prestazioni degli endpoint che incidono sulla latenza [1].

3. Jitter di rete
Jitter è la variabilità della latenza nel tempo. L'elevato jitter può causare prestazioni incoerenti dell'applicazione ed è spesso un segno di instabilità o congestione della rete [1].

4. Perdita di pacchetti
La perdita di pacchetti si verifica quando i pacchetti non riescono a raggiungere la loro destinazione. Anche piccole quantità di perdita di pacchetti possono aumentare significativamente la latenza a causa delle ritrasmissioni e delle prestazioni del TCP degradate [1].

5. Endpoint Health and Disphability
L'acceleratore globale monitora continuamente la salute degli endpoint utilizzando controlli di salute TCP, HTTP e HTTPS. I guasti degli endpoint o lo stato di salute degradato possono causare il reinclicazione del traffico, influendo sulla latenza [7].

Strumenti e registri di monitoraggio AWS

- Metriche e allarmi di Amazon Cloudwatch
Global Accelerator riporta automaticamente le metriche a CloudWatch una volta che il traffico scorre attraverso l'acceleratore. Le metriche chiave di Cloudwatch includono volume del traffico, conteggi endpoint sani e metriche legate alla latenza. È possibile impostare gli allarmi per avvisarti quando la latenza supera le soglie o quando gli endpoint diventano malsani [2] [3] [6] [9].

- Registri del flusso dell'acceleratore globale
I registri di flusso forniscono record dettagliati del traffico che fluiscono attraverso l'acceleratore agli endpoint e tornano ai clienti. Aiutano a risolvere i problemi di raggiungibilità e prestazioni mostrando modelli di traffico e potenziali colli di bottiglia. I registri di flusso richiedono la configurazione e usano Amazon S3 per la memoria [2] [6] [9].

- Registri AWS CloudTrail
CloudTrail Records Chiamate API effettuate all'acceleratore globale, utili per le modifiche alla configurazione di controllo e risoluzione dei problemi che potrebbero influire sulla latenza [2] [6] [9].

Best practice per la diagnosi di latenza

- Misurare la latenza dalle posizioni effettive del cliente per acquisire prestazioni del mondo reale [1].
- Raccogli un gran numero di campioni (ad esempio, almeno 1.000 all'ora per un giorno) per acquisire la variabilità a causa dei picchi di traffico e della congestione di Internet [1].
- Assicurarsi che gli endpoint (istanze EC2, ALBS, NLBS o EIPS) siano in grado di gestire il volume di connessione per evitare colli di bottiglia che aumentano la latenza [1].
- Utilizzare test sintetici con strumenti diversi per convalidare le metriche di latenza e throughput [1].
- Correlare le metriche di CloudWatch con i registri di flusso per identificare se la latenza è dovuta a problemi di rete, salute endpoint o problemi di configurazione [6] [9].

Monitorando queste metriche e sfruttando gli strumenti di monitoraggio AWS, è possibile diagnosticare e risolvere efficacemente i problemi di latenza nell'acceleratore globale AWS.

Citazioni:
[1] https://aws.amazon.com/blogs/networking-and-content-desivery/measuring-aws-global-ackcelerator-performance-and-analyzing-results/
[2] https://docs.aws.amazon.com/global-accelerator/latest/dg/monitoring-global-ackcelerator.html
[3] https://docs.aws.amazon.com/global-accelerator/latest/dg/cloudwatch-monitoring.html
[4] https://docs.aws.amazon.com/global-accelerator/latest/dg/introduction-speed-comparison-tool.html
[5] https://cloudonaut.io/review-aws-global-accelerator-latency-multi-region-disaster-recovery/
[6] https://docs.aws.amazon.com/global-accelerator/latest/dg/logging-and-monitoring.html
[7] https://digitalcloud.training/aws-global-ackcelerator/
[8] https://cloud.google.com/spanner/docs/latency metrics
[9] https://docs.aws.amazon.com/en_us/global-ackcelerator/latest/dg/logging-and-monitoring.html