Để sử dụng giám sát đám mây để xác định các vấn đề về độ trễ trong Trình tăng tốc toàn cầu AWS, bạn có thể tận dụng các số liệu của Amazon CloudWatch và các công cụ liên quan như sau:
1. Giám sát các số liệu CloudWatch cho máy gia tốc toàn cầu
-AWS Global Accelerator tự động xuất bản các số liệu lên Amazon Cloudwatch ở khu vực phía Tây Hoa Kỳ (Oregon) (US-West-2), vì vậy bạn cần xem các số liệu cụ thể ở khu vực đó bất kể máy gia tốc của bạn được triển khai ở đâu [2].
- Các số liệu khóa CloudWatch để tập trung vào bao gồm:
- Độ trễ: Đo thời gian thực hiện lưu lượng truy cập được định tuyến thông qua máy gia tốc toàn cầu đến các điểm cuối của bạn.
- Số lượng điểm cuối lành mạnh/không lành mạnh: Để xác minh xem các điểm cuối có khỏe mạnh hay gây ra sự chậm trễ hay không.
- Khối lượng lưu lượng và tốc độ lỗi: Để tương quan các đột biến về độ trễ với các mẫu lưu lượng hoặc lỗi [2].
- Các số liệu thời gian thực này có thể giúp bạn phát hiện khi độ trễ tăng vượt quá ngưỡng bình thường, báo hiệu các vấn đề về mạng tiềm năng hoặc điểm cuối.
2. Thiết lập báo động CloudWatch
- Tạo báo động về các số liệu độ trễ để được thông báo ngay khi độ trễ vượt qua ngưỡng được xác định trước, cho phép điều tra và khắc phục kịp thời [2].
3. Sử dụng nhật ký lưu lượng để phân tích lưu lượng chi tiết
- Kích hoạt nhật ký luồng gia tốc toàn cầu để nắm bắt thông tin chi tiết về lưu lượng truy cập vào và rời khỏi máy gia tốc [2].
- Nhật ký Flow cung cấp thông tin chi tiết về các chi tiết cấp gói, có thể giúp chẩn đoán các vấn đề về khả năng tiếp cận hoặc định tuyến có thể gây ra độ trễ.
- Lưu ý rằng nhật ký luồng yêu cầu thiết lập và lưu trữ trong Amazon S3.
4. Phân tích thời gian khứ hồi (RTT) và mất gói
- Sử dụng các công cụ chẩn đoán mạng như ping và traceroute từ các vị trí máy khách đến các điểm cuối của máy gia tốc toàn cầu để đo RTT và mất gói [1].
- Mất RTT hoặc gói cao có thể chỉ ra tắc nghẽn mạng hoặc điều chỉnh sự thiếu hiệu quả góp phần vào độ trễ.
-AWS khuyến nghị sử dụng Echo TCP với Traceroute để bỏ qua các bộ lọc tường lửa thông thường và nhận được các phép đo độ trễ chính xác của hop [1].
- Thu thập các phép đo theo định kỳ (ví dụ: cứ sau 5 phút trong một giờ) để quan sát xu hướng độ trễ và xác định các phân đoạn mạng có vấn đề.
5. Tương quan sức khỏe điểm cuối và độ trễ
- Máy gia tốc toàn cầu liên tục theo dõi sức khỏe điểm cuối và định tuyến lại giao thông khỏi các điểm cuối không lành mạnh trong vòng khoảng một phút [8].
- Nếu các vấn đề về độ trễ trùng khớp với suy thoái sức khỏe điểm cuối, hãy điều tra các dịch vụ phụ trợ hoặc bộ cân bằng tải cho các tắc nghẽn hiệu suất.
6. Sử dụng AWS CloudTrail để kiểm toán hoạt động API
- Các cuộc gọi API API tăng tốc toàn cầu của CloudTrail, có thể giúp tương quan các thay đổi cấu hình hoặc triển khai với các gai độ trễ [2].
Bản tóm tắt
Bằng cách kết hợp các số liệu và báo động độ trễ của CloudWatch, nhật ký luồng để biết chi tiết lưu lượng và các phép đo mạng như RTT và Traceroute, bạn có thể xác định hiệu quả và chẩn đoán các vấn đề về độ trễ trong AWS Global Accelerator. Giám sát sức khỏe điểm cuối và tương quan với các mẫu lưu lượng giúp chính xác các nguyên nhân gốc, cho phép bạn tối ưu hóa định tuyến và cải thiện hiệu suất ứng dụng trên toàn cầu [1] [2] [8] [9].
Trích dẫn:
.
[2] https://docs.aws.amazon.com/global-accelerator/latest/dg/monitoring-global-accelerator.html
[3] https://aws.amazon.com/global-accelerator/features/
.
[5] https://www.thousandeyes.com/blog/aws-optimizes-performance-global-accelerator
[6] https://docs.aws.amazon.com/global-accelerator/latest/dg/introduction-how-it-works.html
[7] https://cloud.google.com/spanner/docs/latency-metrics
[8] https://digitalcloud.training/aws-global-accelerator/
[9] https://cloudchipr.com/blog/aws-global-accelerator