AWS Global Accelerator의 건강 검사를위한 모범 사례는 고 가용성과 최적의 트래픽 라우팅을 유지하기 위해 Endpoint Health의 정확하고 안전하며 효율적인 모니터링을 보장하는 데 중점을 둡니다. 아래는 AWS 문서 및 관련 모범 사례를 기반으로 한 자세한 지침입니다.
글로벌 가속기의 건강 검사 구성을위한 주요 모범 사례
1. 적절한 건강 검진 프로토콜 및 포트 사용
- 응용 프로그램의 특성과 엔드 포인트의 응답 능력을 가장 잘 반영하는 건강 검사 프로토콜 (TCP, HTTP 또는 HTTPS)을 선택하십시오. TCP 건강 검사는 Syn 패킷을 보내어 네트워크 수준 연결을 확인하는 반면, HTTP/HTTPS 점검은 실제 HTTP가 응용 프로그램 엔드 포인트에 대한 요청을 시뮬레이션합니다 [6] [9].
- 일관성을 위해 Accelerator의 리스너 포트와 일치하도록 Health Check 포트를 구성하십시오. 건강 점검을 위해 다른 포트를 사용하는 경우 방화벽 및 보안 그룹 규칙이 포트를 공개적으로 노출시키는 것을 방지하기 위해 Route 53 Health Checkers가 사용하는 IP 범위에 대한 액세스를 제한하는지 확인하십시오 [1] [4].
-UDP 리스너가있는 EC2 인스턴스 또는 탄성 IP 엔드 포인트의 경우 Global Accelerator는 리스너 포트에서 TCP 건강 검사를 수행하므로 해당 포트에서 TCP 서버가 실행되고 있는지 확인합니다. 그렇지 않으면 종말점은 건강에 해로운 것으로 표시됩니다 [1].
2. 건강 점검에 대한 보안 및 액세스 보장
- 방화벽 및 라우터 구성에서 Amazon Route 53 건강 검사기와 관련된 IP 주소에서 인바운드 트래픽을 허용하십시오. 이것은 건강 검사가 성공하는 데 중요합니다. 특히 EC2 인스턴스 또는 탄성 IP 엔드 포인트 [1] [4].
-Default가 아닌 건강 검사 포트를 사용할 때는 보안 위험을 피하기 위해 Route 53 Health Check IP 범위에 해당 포트에 대한 액세스를 제한합니다 [1].
- Route 53 Health Checkers가 사용하는 IP 주소 범위의 변경 사항을 수용하기 위해 보안 그룹 규칙을 정기적으로 검토하고 업데이트합니다.
3. 건강 검사 타이밍 매개 변수 구성
- 가동 중지 시간에 대한 응용 프로그램의 허용 오차와 종말점의 중요도를 기반으로 건강 검사 간격 (검사 사이의 시간)을 설정하십시오. 단기간 간격은 고장을 더 빨리 감지하지만 부하와 비용을 증가시키는 반면, 더 긴 간격은 부하를 줄이지 만 실패 감지 지연 [5].
- 민감도와 안정성의 균형을 맞추기 위해 임계 값 수 (엔드 포인트 건강 상태를 변경하기 전에 연속 성공 또는 실패 수)를 구성하십시오. 일반적인 기본값은 3이며, 이는 오 탐지와 탐지 속도 사이에 좋은 상충 관계를 제공합니다 [1] [9].
- 기본 시간 초과 값을 조정 해야하는 특정 이유가없는 한 기본 시간 초과 값을 사용하십시오. 예를 들어, TCP 건강 검사 시간 초과는 Global Accelerator [6]에서 3 초로 고정됩니다.
4. 엔드 포인트 유형과 건강 검사를 조정
- 네트워크로드 밸런서 (NLB) 또는 애플리케이션로드 밸런서 (ALB) 엔드 포인트의 경우 글로벌 가속기가로드 밸런서의 건강 상태를 사용하여 엔드 포인트 건강 상태를 결정하기 때문에 글로벌 가속기가 아닌로드 밸런서 자체의 건강 검사를 구성합니다 [1].
- EC2 인스턴스 또는 탄성 IP 주소의 경우 전체 서비스 가용성을 반영하는 적절한 포트 및 프로토콜을 지정하는 글로벌 가속기에서 건강 검사를 직접 구성합니다 [1].
5. HTTP/HTTPS에 의미있는 건강 검진 경로를 사용하십시오
-HTTP 또는 HTTPS 건강 검사를 사용할 때는 응용 프로그램의 건강을 정확하게 나타내는 URI 경로를 지정합니다 (예 : 홈페이지가 아닌 전용 건강 검진 종점 끝점). 이를 통해 건강 검사는 네트워크 가용성뿐만 아니라 응용 프로그램 수준 준비를 반영합니다 [6].
- 전방 슬래시로 시작하여 허용 된 문자를 포함하여 URI 경로를 간결하고 유효하게 유지하십시오 [6].
6. 건강 검사 메트릭 및 로그 모니터 모니터링 **
- 정기적으로 건강 점검 결과 및 CloudWatch 메트릭을 검토하여 패턴 또는 반복적 인 실패를 식별하십시오. 이것은 사전 문제 해결 및 용량 계획에 도움이됩니다 [5].
- 클라우드 워치 알람을 설정하여 엔드 포인트가 건강에 좋지 않거나 회복 될 때 즉시 팀에 알리므로 사고에 대한 빠른 응답이 가능합니다 [5].
7. 장애 조치 및 복구 전략 구현
- 인스턴트 장애 조치를 위해 트래픽을 건강한 엔드 포인트로만 라우팅하는 글로벌 가속기의 능력을 활용하십시오.
- 엔드 포인트 정전 및 복구 중에 원활한 트래픽 전환을 보장하기 위해 테스트 실패 및 실패 시나리오를 테스트합니다 [5] [8].
8. 건강 수표를 업데이트하십시오
- 포트, 프로토콜 또는 건강 점검 경로의 변경을 포함하여 응용 프로그램이 발전함에 따라 건강 검사 구성을 주기적으로 검토하고 업데이트합니다.
- 불필요한 모니터링 및 잠재적 보안 노출을 피하기 위해 더 이상 사용되지 않는 엔드 포인트에 대한 건강 검사를 제거하십시오 [5].
이러한 모범 사례를 따르면 글로벌 가속기 건강 검사가 엔드 포인트 건강에 대한 정확하고 안전하며시기 적절한 정보를 제공하여 신뢰할 수있는 트래픽 라우팅 및 응용 프로그램의 고 가용성을 가능하게합니다.
인용 :
[1] https://docs.aws.amazon.com/global-accelerator/latest/dg/about-endpoint-groups-health-check-options.html
[2] https://aws.amazon.com/blogs/networking-and-content-delivery/best-practices-for-deployment-with-aw-global-accelerator/
[3] https://docs.aws.amazon.com/global-accelerator/latest/dg/introduction-how-lworks.html
[4] https://repost.aws/knowledge-center/global-accelerator-unhealthy-endpoints
[5] https://docs.aws.amazon.com/route53/latest/developerguide/best-practices-healthchecks.html
[6] https://www.alibabacloud.com/help/en/ga/user-guide/enable-and-manage-health-checks
[7] https://support.huaweicloud.com/intl/en-us/usermanual-ga/ga_03_5002.html
[8] https://tutorialsdojo.com/aws-global-accelerator/
[9] https://boto3.amazonaws.com/v1/documentation/api/1.16.27/reference/services/globalaccelerator.html