要使用云监控来识别AWS全球加速器中的延迟问题,您可以利用Amazon CloudWatch指标和相关工具如下:
1。监视全局加速器的CloudWatch指标
- AWS Global Accelerator自动将指标发布到美国西部(俄勒冈州)地区(US-WEST-2)的Amazon CloudWatch,因此您需要在该区域中特别查看指标,无论其部署何处[2]。
- 关注关注的关键CloudWatch指标包括:
- 延迟:测量通过全局加速器将流量路由到您的端点所需的时间。
- 健康/不健康的终点计数:验证终点是健康还是导致延迟。
- 流量量和错误率:将延迟的峰值与流量模式或错误相关联[2]。
- 这些实时指标可以帮助您检测何时延迟增加超出正常阈值,信号潜在网络或端点问题。
2。设置CloudWatch警报
- 在潜伏期越过预定义的阈值时立即通知延迟指标,从而立即进行调查和补救[2]。
3。使用流日志进行详细的流量分析
- 启用全局加速器流量日志,以捕获有关输入并离开加速器的详细信息[2]。
- 流日志提供了对数据包级别详细信息的见解,这可以帮助诊断可能导致延迟的可及性或路由问题。
- 请注意,流日志需要在Amazon S3中进行设置和存储。
4。分析往返时间(RTT)和数据包丢失
- 使用网络诊断工具,例如从客户端位置到全局加速器端点等网络诊断工具来测量RTT和数据包丢失[1]。
- 高RTT或数据包丢失可以表明网络拥塞或导致延迟的路由效率低下。
- AWS建议将TCP Echo与Traceroute一起绕过通用的防火墙过滤器,并获得准确的逐跳潜伏期测量结果[1]。
- 定期收集测量值(例如,在一个小时内每5分钟一次)观察潜伏期趋势并确定有问题的网络段。
5。关联端点健康和潜伏期
- 全球加速器不断监视端点健康,并在大约一分钟内将流量从不健康的端点移开[8]。
- 如果延迟问题与端点健康退化一致,请研究后端服务或负载平衡器的性能瓶颈。
6。使用AWS CloudTrail进行API活动审核
- CloudTrail日志全局加速器API调用,它可以帮助将配置更改或部署与延迟尖峰相关联[2]。
概括
通过结合CloudWatch延迟指标和警报,流量细节的流日志以及RTT和Traceroute等网络测量值,您可以有效地识别和诊断AWS Global Accelerator中的延迟问题。监视端点健康并与流量模式相关联,进一步有助于确定根本原因,使您能够优化路由并在全球上提高应用程序性能[1] [2] [8] [9]。
引用:
[1] https://aws.amazon.com/blogs/networking-and-content-delivery/measuring-aws-global-accelerator-performance-anderformance-and-analyzing-results/
[2] https://docs.aws.amazon.com/global-accelerator/latest/dg/monitoring-global-accelerator.html
[3] https://aws.amazon.com/global-accelerator/features/
[4] https://cloudonaut.io/review-aws-global-accelerator-latency-multi-rigion-disaster-recovery/
[5] https://www.thoundyeyes.com/blog/aws-optimizes-performance-global-accelerator
[6] https://docs.aws.amazon.com/global-accelerator/latest/dg/introduction-how-it-works.html
[7] https://cloud.google.com/spanner/docs/latency-metrics
[8] https://digitalcloud.training/aws-global-accelerator/
[9] https://cloudchipr.com/blog/aws-global-accelerator