Για να διαγνώσετε προβλήματα λανθάνουσας κατάστασης με το AWS Global Accelerator, θα πρέπει να παρακολουθείτε αρκετές βασικές μετρήσεις και να χρησιμοποιήσετε εργαλεία παρακολούθησης AWS για να λάβετε λεπτομερείς πληροφορίες:
Βασικές μετρήσεις για παρακολούθηση
1.
Το RTT μετράει το χρόνο που χρειάζεται για ένα πακέτο να ταξιδέψει από τον πελάτη στο τελικό σημείο και την πλάτη. Είναι η πρωταρχική μέτρηση για την αξιολόγηση της καθυστέρησης του δικτύου και επηρεάζεται από τις φυσικές συνθήκες και τις συνθήκες δικτύου. Η παρακολούθηση RTT βοηθά στον εντοπισμό του τόπου όπου εισάγεται η καθυστέρηση στη διαδρομή [1].
2. Διακίνηση
Αυτό μετρά το ποσό των δεδομένων ή του αριθμού των πακέτων που παραδίδονται για μια χρονική περίοδο. Η χαμηλή απόδοση μπορεί να υποδεικνύει συμφόρηση δικτύου ή ζητήματα απόδοσης τελικού σημείου που επηρεάζουν την καθυστέρηση [1].
3.
Το Jitter είναι η μεταβλητότητα στην καθυστέρηση με την πάροδο του χρόνου. Το High Jitter μπορεί να προκαλέσει ασυνεπή απόδοση εφαρμογών και είναι συχνά ένα σημάδι αστάθειας δικτύου ή συμφόρησης [1].
4. Απώλεια πακέτων
Η απώλεια πακέτων συμβαίνει όταν τα πακέτα αποτυγχάνουν να φτάσουν στον προορισμό τους. Ακόμη και οι μικρές ποσότητες απώλειας πακέτων μπορούν να αυξήσουν σημαντικά την καθυστέρηση λόγω των αναμεταγωγών και της υποβαθμισμένης απόδοσης TCP [1].
5. Υγεία και διαθεσιμότητα τελικού σημείου
Το Global Accelerator παρακολουθεί συνεχώς την υγεία των τελικών σημείων χρησιμοποιώντας ελέγχους υγείας TCP, HTTP και HTTPS. Οι αποτυχίες του τελικού σημείου ή η υποβαθμισμένη κατάσταση υγείας μπορούν να προκαλέσουν την επαναφορά της κυκλοφορίας, επηρεάζοντας την καθυστέρηση [7].
Εργαλεία παρακολούθησης AWS και αρχεία καταγραφής
- μετρήσεις και συναγερμοί Amazon CloudWatch
Το Global Accelerator αναφέρει αυτόματα μετρήσεις στο CloudWatch μόλις η κυκλοφορία ρέει μέσω του επιταχυντή. Οι βασικές μετρήσεις CloudWatch περιλαμβάνουν τον όγκο της κυκλοφορίας, τους υγιείς μετρήσεις τελικών σημείων και τις μετρήσεις που σχετίζονται με την καθυστέρηση. Μπορείτε να ορίσετε συναγερμούς για να σας ειδοποιήσετε όταν η καθυστέρηση υπερβαίνει τα κατώτατα όρια ή όταν τα τελικά σημεία γίνονται ανθυγιεινά [2] [3] [6] [9].
- Καταγράφους ροής παγκόσμιου επιταχυντή
Τα αρχεία καταγραφής ροής παρέχουν λεπτομερή αρχεία της κυκλοφορίας που ρέουν μέσω του επιταχυντή σε τελικά σημεία και πίσω στους πελάτες. Βοηθούν στην αντιμετώπιση προβλημάτων προσβασιμότητας και απόδοσης, δείχνοντας πρότυπα κυκλοφορίας και πιθανές συμφόρηση. Τα αρχεία καταγραφής ροής απαιτούν ρύθμιση και χρησιμοποιήστε το Amazon S3 για αποθήκευση [2] [6] [9].
- AWS CloudTrail Logs
Το CloudTrail καταγράφει κλήσεις API που έγιναν στον Global Accelerator, χρήσιμες για τις αλλαγές διαμόρφωσης ελέγχου και αντιμετώπισης προβλημάτων που ενδέχεται να επηρεάσουν την καθυστέρηση [2] [6] [9].
Βέλτιστες πρακτικές για τη διάγνωση λανθάνουσας κατάστασης
- Μετρήστε την καθυστέρηση από τις πραγματικές θέσεις πελατών για να καταγράψετε την πραγματική απόδοση [1].
- Συλλέξτε μεγάλο αριθμό δειγμάτων (π.χ., τουλάχιστον 1.000 ανά ώρα για μια ημέρα) για να καταγράψετε τη μεταβλητότητα λόγω κορυφών της κυκλοφορίας και συμφόρησης στο διαδίκτυο [1].
- Βεβαιωθείτε ότι τα τελικά σημεία (EC2 παρουσιάσεις, ALBS, NLBS ή EIPs) είναι σε θέση να χειριστούν τον όγκο σύνδεσης για να αποφευχθούν τα σημεία συμφόρησης που αυξάνουν την καθυστέρηση [1].
- Χρησιμοποιήστε συνθετικές δοκιμές με διαφορετικά εργαλεία για την επικύρωση μετρήσεων λανθάνουσας κατάστασης και διακίνησης [1].
- Συσχετίστε τις μετρήσεις CloudWatch με αρχεία καταγραφής ροής για να προσδιορίσετε εάν η καθυστέρηση οφείλεται σε προβλήματα δικτύου, υγεία τελικού σημείου ή προβλήματα διαμόρφωσης [6] [9].
Παρακολουθώντας αυτές τις μετρήσεις και τη μόχλευση εργαλείων παρακολούθησης AWS, μπορείτε να διαγνώσετε και να αντιμετωπίσετε τα προβλήματα λανθάνουσας κατάστασης στο AWS Global Accelerator.
Αναφορές:
[1] https://aws.amazon.com/blogs/networking-and-content-delivery/measuring-aws-global-accelerator-performance-
[2] https://docs.aws.amazon.com/global-accelerator/latest/dg/monitoring-global-accelerator.html
[3] https://docs.aws.amazon.com/global-accelerator/latest/dg/cloudwatch-monitoring.html
[4] https://docs.aws.amazon.com/global-accelerator/latest/dg/introduction-speed-comparison-pol.html
[5] https://cloudonaut.io/review-aws-global-accelerator-latency-multi-region-disaster-recovery/
[6] https://docs.aws.amazon.com/global-accelerator/latest/dg/logging-and-monitoring.html
[7] https://digitalcloud.training/aws-global-accelerator/
[8] https://cloud.google.com/spanner/docs/latency-metrics
[9] https://docs.aws.amazon.com/en_us/global-accelerator/latest/dg/logging-and-monitoring.html