클라우드 모니터링을 사용하여 AWS Global Accelerator에서 대기 시간 문제를 식별하려면 Amazon CloudWatch 메트릭 및 관련 도구를 다음과 같이 활용할 수 있습니다.
1. 글로벌 가속기를위한 CloudWatch 메트릭 모니터
-AWS Global Accelerator는 미국 서부 (Oregon) 지역 (US-West-2)의 Amazon Cloudwatch에 메트릭을 자동으로 게시하므로 가속기가 배포되는 위치에 관계없이 해당 지역의 메트릭을 구체적으로 볼 필요가 있습니다 [2].
- 초점을 맞출 주요 CloudWatch 메트릭에 중점을 둡니다.
- 대기 시간 : 전역 가속기를 통해 엔드 포인트로 트래픽을 라우팅하는 데 걸리는 시간을 측정합니다.
- 건강하고 건강에 해로운 종말점 수 : 엔드 포인트가 건강하거나 지연되는지 확인합니다.
- 트래픽 볼륨 및 오류율 : 트래픽 패턴 또는 오류와 대기 시간의 스파이크를 상관시킵니다 [2].
- 이러한 실시간 측정 항목은 대기 시간이 일반 임계 값을 넘어서서 잠재적 인 네트워크 또는 종말점 문제를 신호 전환시기를 감지하는 데 도움이 될 수 있습니다.
2. 클라우드 워치 알람 설정
- 대기 시간 메트릭에서 알람 생성을 생성하여 대기 시간이 사전 정의 된 임계 값을 가로 지르면 즉시 알림을 받으므로 프롬프트 조사 및 개선이 가능합니다 [2].
3. 상세한 트래픽 분석을 위해 흐름 로그를 사용하십시오
- 글로벌 가속기 흐름 로그를 활성화하여 트래픽을 입력하고 가속기를 떠나는 것에 대한 자세한 정보를 캡처합니다 [2].
- 흐름 로그는 패킷 레벨 세부 사항에 대한 통찰력을 제공하여 대기 시간을 유발할 수있는 도달 성 또는 라우팅 문제를 진단하는 데 도움이 될 수 있습니다.
- 흐름 로그는 Amazon S3에서 설정 및 스토리지가 필요합니다.
4. 왕복 시간 (RTT) 및 패킷 손실 분석
-Ping 및 Traceroute와 같은 네트워크 진단 도구를 사용하여 클라이언트 위치에서 글로벌 가속기 엔드 포인트까지 RTT 및 패킷 손실을 측정합니다 [1].
- 높은 RTT 또는 패킷 손실은 네트워크 혼잡 또는 라우팅 비 효율성이 대기 시간에 기여 함을 나타낼 수 있습니다.
-AWS는 Traceroute와 함께 TCP Echo를 사용하여 일반적인 방화벽 필터를 우회하고 정확한 홉 별 대기 시간 측정을 권장합니다 [1].
- 대기 시간 추세를 관찰하고 문제가있는 네트워크 세그먼트를 식별하기 위해 주기적으로 측정을 수집하십시오 (예 : 1 시간에 5 분마다).
5. 엔드 포인트 건강 및 대기 시간의 상관
- 글로벌 가속기는 지속적으로 Endpoint Health를 지속적으로 모니터링하고 약 1 분 안에 건강에 해로운 엔드 포인트에서 트래픽을 다시 라우팅합니다 [8].
- 대기 시간 문제가 엔드 포인트 건강 저하와 일치하는 경우 성능 병목 현상을 위해 백엔드 서비스 또는로드 밸런서를 조사하십시오.
6. API 활동 감사에 AWS CloudTrail 사용
- CloudTrail은 Global Accelerator API 호출을 기록하여 구성 변경 또는 배포를 대기 시간 스파이크와 관련시키는 데 도움이 될 수 있습니다 [2].
요약
CloudWatch 대기 시간 메트릭 및 알람, 트래픽 세부 사항을위한 흐름 로그 및 RTT 및 TracerOute와 같은 네트워크 측정을 결합하면 AWS Global Accelerator에서 대기 시간 문제를 효과적으로 식별하고 진단 할 수 있습니다. 엔드 포인트 건강을 모니터링하고 트래픽 패턴과의 상관 관계가 더욱 근본 원인을 정확히 찾아내어 전 세계적으로 라우팅을 최적화하고 애플리케이션 성능을 향상시킬 수 있습니다 [1] [2] [8] [9].
인용 :
[1] https://aws.amazon.com/blogs/networking-and-content-delivery/measuring-aw-global-accelerator-performance-and-analyzing-tults/
[2] https://docs.aws.amazon.com/global-accelerator/latest/dg/monitoring-global-accelerator.html
[3] https://aws.amazon.com/global-accelerator/features/
[4] https://cloudonaut.io/review-aws-global-accelerator-latency-multi-disaster-recovery/
[5] https://www.thonconeyes.com/blog/aws-optimizes-performance-global-accelerator
[6] https://docs.aws.amazon.com/global-accelerator/latest/dg/introduction-how-lworks.html
[7] https://cloud.google.com/spanner/docs/latency-metrics
[8] https://digitalcloud.training/aws-global-accelerator/
[9] https://cloudchipr.com/blog/aws-global-accelerator