Thực tiễn tốt nhất để định cấu hình kiểm tra sức khỏe trong AWS Global Accelerator tập trung vào việc đảm bảo giám sát chính xác, an toàn và hiệu quả của sức khỏe điểm cuối để duy trì tính khả dụng cao và định tuyến giao thông tối ưu. Dưới đây là các hướng dẫn chi tiết dựa trên tài liệu AWS và thực tiễn tốt nhất liên quan:
Thực hành tốt nhất để định cấu hình kiểm tra sức khỏe trong máy gia tốc toàn cầu
1. Sử dụng các giao thức và cổng kiểm tra sức khỏe thích hợp
- Chọn Giao thức kiểm tra sức khỏe (TCP, HTTP hoặc HTTPS) phản ánh tốt nhất bản chất của ứng dụng của bạn và khả năng phản hồi của điểm cuối. Kiểm tra sức khỏe của TCP Xác minh kết nối cấp mạng bằng cách gửi các gói SYN, trong khi kiểm tra HTTP/HTTP mô phỏng HTTP thực tế Nhận các yêu cầu đến các điểm cuối ứng dụng [6] [9].
- Định cấu hình cổng kiểm tra sức khỏe để phù hợp với cổng người nghe trên máy gia tốc của bạn để có tính nhất quán. Nếu bạn sử dụng một cổng khác để kiểm tra sức khỏe, hãy đảm bảo rằng các quy tắc của tường lửa và nhóm bảo mật hạn chế quyền truy cập chỉ vào các phạm vi IP được sử dụng bởi các trình kiểm tra sức khỏe của Tuyến 53 để ngăn chặn việc hiển thị cổng công khai [1] [4].
- Đối với các phiên bản EC2 hoặc điểm cuối IP đàn hồi với người nghe UDP, Trình tăng tốc toàn cầu thực hiện kiểm tra sức khỏe TCP trên cổng người nghe, do đó, đảm bảo máy chủ TCP đang chạy trên cổng đó; Nếu không, các điểm cuối sẽ được đánh dấu là không lành mạnh [1].
2. Đảm bảo an ninh và truy cập để kiểm tra sức khỏe
- Cho phép lưu lượng truy cập trong các địa chỉ IP được liên kết với các trình kiểm tra sức khỏe của Amazon Route 53 trong cấu hình tường lửa và bộ định tuyến của bạn. Điều này rất quan trọng để kiểm tra sức khỏe thành công, đặc biệt là đối với trường hợp EC2 hoặc điểm cuối IP đàn hồi [1] [4].
- Khi sử dụng cổng kiểm tra sức khỏe không mặc định, chỉ giới hạn quyền truy cập vào cổng đó vào các phạm vi IP kiểm tra sức khỏe của Tuyến 53 để tránh rủi ro bảo mật [1].
- Thường xuyên xem xét và cập nhật các quy tắc nhóm bảo mật để phù hợp với mọi thay đổi trong phạm vi địa chỉ IP được sử dụng bởi Route 53 Checkers Health.
3. Định cấu hình các thông số thời gian kiểm tra sức khỏe một cách chu đáo
- Đặt khoảng thời gian kiểm tra sức khỏe (thời gian giữa các kiểm tra) dựa trên khả năng chịu đựng của ứng dụng của bạn đối với thời gian chết và mức độ quan trọng của điểm cuối. Các khoảng thời gian ngắn phát hiện lỗi nhanh hơn nhưng tăng tải và chi phí, trong khi các khoảng thời gian dài hơn giảm tải nhưng phát hiện thất bại chậm trễ [5].
- Định cấu hình số lượng ngưỡng (số lượng thành công liên tiếp hoặc thất bại trước khi thay đổi tình trạng sức khỏe điểm cuối) để cân bằng độ nhạy và ổn định. Một mặc định chung là 3, cung cấp sự đánh đổi tốt giữa dương tính giả và tốc độ phát hiện [1] [9].
- Sử dụng các giá trị thời gian chờ mặc định trừ khi bạn có lý do cụ thể để điều chỉnh chúng. Ví dụ, thời gian chờ kiểm tra sức khỏe TCP được cố định ở 3 giây trong máy gia tốc toàn cầu [6].
4. Căn chỉnh kiểm tra sức khỏe với các loại điểm cuối
- Đối với bộ cân bằng tải mạng (NLB) hoặc điểm cuối cân bằng tải ứng dụng (ALB), định cấu hình kiểm tra sức khỏe trên chính bộ cân bằng tải thay vì trong máy gia tốc toàn cầu, vì bộ tăng tốc toàn cầu sử dụng trạng thái sức khỏe của bộ cân bằng tải để xác định sức khỏe điểm cuối [1].
- Đối với các trường hợp EC2 hoặc địa chỉ IP đàn hồi, định cấu hình kiểm tra sức khỏe trực tiếp trong máy gia tốc toàn cầu, chỉ định các cổng và giao thức thích hợp phản ánh tính khả dụng của dịch vụ thực tế [1].
5. Sử dụng đường dẫn kiểm tra sức khỏe có ý nghĩa cho HTTP/HTTPS
- Khi sử dụng kiểm tra sức khỏe HTTP hoặc HTTPS, hãy chỉ định đường dẫn URI đại diện chính xác cho sức khỏe của ứng dụng của bạn (ví dụ: điểm cuối kiểm tra sức khỏe chuyên dụng thay vì trang chủ). Điều này đảm bảo kiểm tra sức khỏe phản ánh sự sẵn sàng ở cấp độ ứng dụng, không chỉ tính khả dụng của mạng [6].
- Giữ đường dẫn URI ngắn gọn và hợp lệ, bắt đầu bằng một dấu gạch chéo về phía trước và chứa các ký tự cho phép [6].
6. Giám sát các số liệu kiểm tra sức khỏe và nhật ký
- Thường xuyên xem xét kết quả kiểm tra sức khỏe và số liệu CloudWatch để xác định các mẫu hoặc lỗi định kỳ. Điều này giúp xử lý sự cố và lập kế hoạch năng lực chủ động [5].
- Thiết lập báo động CloudWatch để thông báo cho nhóm của bạn ngay lập tức khi các điểm cuối trở nên không lành mạnh hoặc phục hồi, cho phép ứng phó nhanh chóng với các sự cố [5].
7. Thực hiện các chiến lược chuyển đổi dự phòng và phục hồi
- Tận dụng khả năng của máy gia tốc toàn cầu chỉ định tuyến lưu lượng truy cập đến các điểm cuối lành mạnh cho chuyển đổi dự phòng ngay lập tức.
- KIỂM TRA KIỂM TRA và các kịch bản failback để đảm bảo chuyển đổi lưu lượng trơn tru trong quá trình ngừng hoạt động và phục hồi điểm cuối [5] [8].
8. Giữ kiểm tra sức khỏe được cập nhật
- Định kỳ xem xét và cập nhật Cấu hình kiểm tra sức khỏe khi ứng dụng của bạn phát triển, bao gồm các thay đổi trong các cổng, giao thức hoặc đường dẫn kiểm tra sức khỏe.
- Loại bỏ kiểm tra sức khỏe cho các điểm cuối không còn được sử dụng để tránh theo dõi không cần thiết và phơi nhiễm bảo mật tiềm năng [5].
Bằng cách làm theo các thực tiễn tốt nhất này, bạn đảm bảo rằng kiểm tra sức khỏe tăng tốc toàn cầu cung cấp thông tin chính xác, an toàn và kịp thời về sức khỏe điểm cuối, cho phép định tuyến giao thông đáng tin cậy và tính khả dụng cao cho các ứng dụng của bạn.
Trích dẫn:
[1] https://docs.aws.amazon.com/global-accelerator/latest/dg/about-endpoint-groups-health-check-options.html
.
[3] https://docs.aws.amazon.com/global-accelerator/latest/dg/introduction-how-it-works.html
[4] https://repost.aws/knowledge-center/global-accelerator-unhealthy-endpoints
[5] https://docs.aws.amazon.com/Route53/latest/DeveloperGuide/best-practices-healthchecks.html
[6] https://www.alibabacloud.com/help/en/ga/user-guide/enable-and-manage-health-checks
[7] https://support.huaweicloud.com/intl/en-us/usermanual-ga/ga_03_5002.html
[8] https://tutorialsdojo.com/aws-global-accelerator/
[9] https://boto3.amazonaws.com/v1/documentation/api/1.16.27/reference/services/globalaccelerator.html