Για να χρησιμοποιήσετε την παρακολούθηση του cloud για τον εντοπισμό προβλημάτων λανθάνουσας κατάστασης στο AWS Global Accelerator, μπορείτε να εκμεταλλευτείτε τις μετρήσεις του Amazon CloudWatch και τα συναφή εργαλεία ως εξής:
1. Παρακολουθήστε τις μετρήσεις cloudwatch για παγκόσμιο επιταχυντή
-Ο AWS Global Accelerator δημοσιεύει αυτόματα μετρήσεις στο Amazon CloudWatch στην περιοχή των ΗΠΑ West (Oregon) (US-WEST-2), οπότε πρέπει να δείτε μετρήσεις ειδικά σε αυτήν την περιοχή, ανεξάρτητα από το πού αναπτύσσεται ο επιταχυντής σας [2].
- Οι μετρήσεις Key CloudWatch για να επικεντρωθούν περιλαμβάνουν:
- Latency: Μετράει το χρόνο που απαιτείται για την δρομολόγηση της κυκλοφορίας μέσω του παγκόσμιου επιταχυντή στα τελικά σημεία σας.
- Υγιεινές/ανθυγιεινές μετρήσεις τελικών σημείων: Για να επαληθεύσετε εάν τα τελικά σημεία είναι υγιή ή προκαλούν καθυστερήσεις.
- Ποσοστά όγκου και σφάλματος της κυκλοφορίας: Για να συσχετιστούν αιχμές στην καθυστέρηση με πρότυπα κυκλοφορίας ή σφάλματα [2].
- Αυτές οι μετρήσεις σε πραγματικό χρόνο μπορούν να σας βοηθήσουν να ανιχνεύσετε πότε η λανθάνουσα κατάσταση αυξάνεται πέρα από τα κανονικά κατώτατα όρια, σηματοδοτώντας δυνητικά θέματα δικτύου ή τελικού σημείου.
2. Ρύθμιση συναγερμών cloudwatch
- Δημιουργήστε συναγερμούς σχετικά με τις μετρήσεις λανθάνουσας κατάστασης για να ενημερωθείτε αμέσως όταν η λανθάνουσα κατάσταση διασχίζει ένα προκαθορισμένο όριο, επιτρέποντας την άμεση έρευνα και αποκατάσταση [2].
3. Χρησιμοποιήστε αρχεία καταγραφής ροής για λεπτομερή ανάλυση κυκλοφορίας
- Ενεργοποιήστε τα αρχεία καταγραφής ροής παγκόσμιου επιταχυντή για να καταγράψετε λεπτομερείς πληροφορίες σχετικά με την είσοδο και την έξοδο από τον επιταχυντή [2].
- Τα αρχεία καταγραφής ροής παρέχουν πληροφορίες σχετικά με τις λεπτομέρειες σε επίπεδο πακέτων, οι οποίες μπορούν να βοηθήσουν στη διάγνωση προβλημάτων προσοχής ή δρομολόγησης που ενδέχεται να προκαλέσουν λανθάνουσα κατάσταση.
- Σημειώστε ότι τα αρχεία καταγραφής ροής απαιτούν εγκατάσταση και αποθήκευση στο Amazon S3.
4. Αναλύστε το χρόνο μετ 'επιστροφής (RTT) και την απώλεια πακέτων
- Χρησιμοποιήστε εργαλεία διαγνωστικών δικτύων, όπως ping και traceroute από τοποθεσίες πελατών έως τα τελικά σημεία επιταχυντής για να μετρήσετε την RTT και την απώλεια πακέτων [1].
- Η υψηλή απώλεια RTT ή πακέτων μπορεί να υποδεικνύει τη συμφόρηση του δικτύου ή την αναποτελεσματικότητα της δρομολόγησης που συμβάλλουν στην καθυστέρηση.
-Το AWS συνιστά τη χρήση TCP Echo με το Traceroute για να παρακάμψει τα κοινά φίλτρα τείχους προστασίας και να λάβετε ακριβείς μετρήσεις λανθάνουσας λανθάνουσας κατάστασης [1].
- Συλλέξτε τις μετρήσεις περιοδικά (π.χ. κάθε 5 λεπτά σε μια ώρα) για να παρατηρηθούν τάσεις λανθάνουσας κατάστασης και να εντοπίσετε προβληματικά τμήματα δικτύου.
5. Συσχετίστε την υγεία και την καθυστέρηση του τελικού σημείου
- Ο παγκόσμιος επιταχυντής παρακολουθεί συνεχώς την υγεία του τελικού σημείου και επαναφέρει την κυκλοφορία μακριά από τα ανθυγιεινά τελικά σημεία μέσα σε περίπου ένα λεπτό [8].
- Εάν τα ζητήματα λανθάνουσας κατάστασης συμπίπτουν με την υποβάθμιση της υγείας του τελικού σημείου, διερευνήστε τις υπηρεσίες backend ή τους balancers φορτίου για τα σημεία συμφόρησης απόδοσης.
6. Χρησιμοποιήστε το AWS CloudTrail για τον έλεγχο της δραστηριότητας API
- Το CloudTrail καταγράφει τις κλήσεις API Global Accelerator, οι οποίες μπορούν να βοηθήσουν στη συσχέτιση των αλλαγών διαμόρφωσης ή των αναπτύξεων με αιχμές λανθάνουσας κατάστασης [2].
Περίληψη
Συνδυάζοντας τις μετρήσεις και τους συναγερμούς της λανθάνουσας κατάστασης CloudWatch, τα αρχεία καταγραφής ροής για λεπτομέρειες κυκλοφορίας και τις μετρήσεις δικτύου όπως το RTT και το Traceroute, μπορείτε να εντοπίσετε αποτελεσματικά και να διαγνώστε προβλήματα λανθάνουσας κατάστασης στο AWS Global Accelerator. Η παρακολούθηση της υγείας του τελικού σημείου και η συσχέτιση με τα πρότυπα κυκλοφορίας βοηθά περαιτέρω την εντοπισμό των ριζικών αιτιών, επιτρέποντάς σας να βελτιστοποιήσετε τη δρομολόγηση και να βελτιώσετε την απόδοση των εφαρμογών παγκοσμίως [1] [2] [8] [9].
Αναφορές:
[1] https://aws.amazon.com/blogs/networking-and-content-delivery/measuring-aws-global-accelerator-performance-
[2] https://docs.aws.amazon.com/global-accelerator/latest/dg/monitoring-global-accelerator.html
[3] https://aws.amazon.com/global-accelerator/features/
[4] https://cloudonaut.io/review-aws-global-accelerator-latency-multi-region-disaster-recovery/
[5] https://www.thouldeyes.com/blog/aws-optimizes-performance-global-ccelerator
[6] https://docs.aws.amazon.com/global-accelerator/latest/dg/introduction-how-it-works.html
[7] https://cloud.google.com/spanner/docs/latency-metrics
[8] https://digitalcloud.training/aws-global-accelerator/
[9] https://cloudchipr.com/blog/aws-global-accelerator