Để chẩn đoán các vấn đề về độ trễ với máy gia tốc toàn cầu AWS, bạn nên theo dõi một số số liệu chính và sử dụng các công cụ giám sát AWS để có được những hiểu biết chi tiết:
Số liệu chính để theo dõi
1. Thời gian khứ hồi (RTT) / Độ trễ
RTT đo thời gian để một gói đi từ khách hàng đến điểm cuối và trở lại. Đây là số liệu chính để đánh giá độ trễ mạng và bị ảnh hưởng bởi khoảng cách vật lý và các điều kiện mạng. Giám sát RTT giúp xác định nơi có độ trễ được giới thiệu trong đường dẫn [1].
2. Thông lượng
Điều này đo lường số lượng dữ liệu hoặc số lượng gói được phân phối trong một khoảng thời gian. Thông lượng thấp có thể chỉ ra tắc nghẽn mạng hoặc các vấn đề về hiệu suất điểm cuối ảnh hưởng đến độ trễ [1].
3. Jitter mạng
Jitter là sự thay đổi về độ trễ theo thời gian. Jitter cao có thể gây ra hiệu suất ứng dụng không nhất quán và thường là dấu hiệu của sự bất ổn hoặc tắc nghẽn mạng [1].
4. Mất gói
Mất gói xảy ra khi các gói không đến đích. Ngay cả một lượng nhỏ mất gói có thể làm tăng đáng kể độ trễ do truyền lại và hiệu suất TCP bị suy giảm [1].
5. Sức khỏe và tính khả dụng của điểm cuối
Máy gia tốc toàn cầu liên tục theo dõi sức khỏe của các điểm cuối bằng cách sử dụng kiểm tra sức khỏe TCP, HTTP và HTTPS. Thất bại điểm cuối hoặc tình trạng sức khỏe xuống cấp có thể khiến lưu lượng được định tuyến lại, ảnh hưởng đến độ trễ [7].
Công cụ giám sát AWS và nhật ký
- Các số liệu và báo thức của Amazon CloudWatch
Global Accelerator tự động báo cáo các số liệu cho CloudWatch sau khi lưu lượng truy cập chảy qua máy gia tốc. Các số liệu chính của CloudWatch bao gồm lưu lượng giao thông, số điểm cuối lành mạnh và các số liệu liên quan đến độ trễ. Bạn có thể đặt báo thức để thông báo cho bạn khi độ trễ vượt quá ngưỡng hoặc khi các điểm cuối trở nên không lành mạnh [2] [3] [6] [9].
- Nhật ký dòng máy gia tốc toàn cầu
Nhật ký Flow cung cấp các bản ghi chi tiết về lưu lượng truy cập chảy qua máy gia tốc đến các điểm cuối và quay lại cho khách hàng. Chúng giúp khắc phục sự cố về khả năng tiếp cận và các vấn đề hiệu suất bằng cách hiển thị các mẫu lưu lượng và các tắc nghẽn tiềm năng. Nhật ký lưu lượng yêu cầu thiết lập và sử dụng Amazon S3 để lưu trữ [2] [6] [9].
- Nhật ký AWS CloudTrail
Các cuộc gọi API của CloudTrail Records được thực hiện cho Trình tăng tốc toàn cầu, hữu ích cho việc kiểm toán và khắc phục các thay đổi cấu hình có thể ảnh hưởng đến độ trễ [2] [6] [9].
Thực hành tốt nhất để chẩn đoán độ trễ
- Đo độ trễ từ các vị trí máy khách thực tế để nắm bắt hiệu suất trong thế giới thực [1].
- Thu thập một số lượng lớn các mẫu (ví dụ: ít nhất 1.000 mỗi giờ trong một ngày) để thu được sự thay đổi do các đỉnh lưu lượng truy cập và tắc nghẽn Internet [1].
- Đảm bảo các điểm cuối (các trường hợp EC2, ALBS, NLB hoặc EIP) có khả năng xử lý khối lượng kết nối để tránh tắc nghẽn làm tăng độ trễ [1].
- Sử dụng các bài kiểm tra tổng hợp với các công cụ khác nhau để xác thực độ trễ và số liệu thông lượng [1].
- Tương quan các số liệu CloudWatch với nhật ký luồng để xác định xem độ trễ là do các vấn đề về mạng, sức khỏe điểm cuối hoặc các vấn đề cấu hình [6] [9].
Bằng cách theo dõi các số liệu này và tận dụng các công cụ giám sát AWS, bạn có thể chẩn đoán và khắc phục các vấn đề về độ trễ trong AWS Global Compressator một cách hiệu quả.
Trích dẫn:
.
[2] https://docs.aws.amazon.com/global-accelerator/latest/dg/monitoring-global-accelerator.html
[3] https://docs.aws.amazon.com/global-accelerator/latest/dg/cloudwatch-monitoring.html
[4] https://docs.aws.amazon.com/global-accelerator/latest/dg/introduction-speed-comparison-tool.html
.
[6] https://docs.aws.amazon.com/global-accelerator/latest/dg/logging-and-monitoring.html
[7] https://digitalcloud.training/aws-global-accelerator/
[8] https://cloud.google.com/spanner/docs/latency-metrics
[9] https://docs.aws.amazon.com/en_us/global-accelerator/latest/dg/logging-and-monitoring.html