Chcete -li použít cloudové monitorování k identifikaci problémů s latence v AWS Global Accelerator, můžete využít metriky Amazon CloudWatch a související nástroje takto:
1. Monitorujte metriky CloudWatch pro globální akcelerátor
-AWS Global Accelerator automaticky publikuje metriky na Amazon CloudWatch v oblasti USA West (Oregon) (US-West-2), takže musíte zobrazit metriky konkrétně v této oblasti bez ohledu na to, kde je váš akcelerátor nasazen [2].
- Klíčové metriky CloudWatch, na které se zaměříte: zahrnují:
- Latence: Měří čas potřebný k směrování provozu globálním akcelerátorem do vašich koncových bodů.
- Zdravé/nezdravé počty koncových bodů: Ověřte, zda jsou koncové body zdravé nebo způsobují zpoždění.
- Míra objemu provozu a chybovosti: Korelovat hroty v latence se vzory provozu nebo chybami [2].
- Tyto metriky v reálném čase vám mohou pomoci zjistit, kdy se latence zvyšuje nad normální prahové hodnoty, signalizační potenciální síť nebo problémy s koncovým bodem.
2. Nastavit alarmy CloudWatch
- Vytvořte alarmy na metrikách latence, abyste byli okamžitě informováni, když latence překročí předdefinovaný prah, což umožňuje rychlé zkoumání a nápravu [2].
3. Pro podrobnou analýzu provozu používejte protokoly toku
- Umožněte protokolu toku globálního akcelerátoru zachytit podrobné informace o vstupu do provozu a opuštění akcelerátoru [2].
- Protokoly toku poskytují vhled do detailů na úrovni paketů, které mohou pomoci diagnostikovat dosažitelnosti nebo problémy s směrováním, které by mohly způsobit latenci.
- Všimněte si, že protokoly toku vyžadují nastavení a úložiště v Amazonu S3.
4. Analyzujte čas zpáteční cesty (RTT) a ztráta paketů
- Použijte diagnostické nástroje sítě, jako jsou Ping a Traceroute z míst klientů do koncových bodů globálního akcelerátoru, abyste změřili ztrátu RTT a paketů [1].
- Vysoká ztráta RTT nebo paketů může naznačovat přetížení sítě nebo směrování neefektivnosti přispívajících k latenci.
-AWS doporučuje použít TCP Echo s Traceroute, aby obešel běžné filtry brány firewall a získal přesné měření latence hop-po-hop [1].
- Sbírejte měření pravidelně (např. Každých 5 minut po dobu jedné hodiny), abyste sledovali trendy latence a identifikovali problematické síťové segmenty.
5. Korelovat zdraví koncových bodů a latence
- Globální akcelerátor nepřetržitě monitoruje zdraví koncového bodu a přesměruje provoz daleko od nezdravých koncových bodů přibližně za minutu [8].
- Pokud se problémy latence shodují s degradací zdraví koncových bodů, prozkoumejte backendové služby nebo vyvažovače zatížení pro úzké místo v oblasti výkonu.
6. Použijte AWS CloudTrail pro audit aktivity API
- Protokoly CloudTrail Logs Global Accelerator API volání, které mohou pomoci korelovat změny konfigurace nebo nasazení pomocí špiček latence [2].
Shrnutí
Kombinací metrik a alarmů latence CloudWatch, protokoly toku pro detaily provozu a měření sítě, jako je RTT a Traceroute, můžete v Global Accelerator efektivně identifikovat a diagnostikovat problémy s latencí. Monitorování zdraví koncového bodu a korelace s vzory provozu dále pomáhá určit příčiny kořenů, což vám umožní optimalizovat směrování a zlepšit výkon aplikací po celém světě [1] [2] [8] [9].
Citace:
[1] https://aws.amazon.com/blogs/networking-and-content-delivery/Measuring-aws-global-accelerator-Performance-and-analyzing-results/
[2] https://docs.aws.amazon.com/global-accelerator/latest/dg/monitoring-global-accelerator.html
[3] https://aws.amazon.com/global-accelerator/features/
[4] https://cloudonaut.io/review-aws-global-accelerator-latence-multi-region-disaster-recovery/
[5] https://www.thotíseyes.com/blog/aws-optimizes-Performance-Global-Accelerator
[6] https://docs.aws.amazon.com/global-accelerator/latest/dg/introduction-it-works.html
[7] https://cloud.google.com/spanner/docs/latency-metrics
[8] https://digitalcloud.training/aws-global-accelerator/
[9] https://cloudchipr.com/blog/aws-global-ccelerator