Лучшие методы настройки проверки здоровья в AWS Global Accelerator фокусируются на обеспечении точного, безопасного и эффективного мониторинга здоровья конечной точки для поддержания высокой доступности и оптимальной маршрутизации трафика. Ниже приведены подробные рекомендации, основанные на документации AWS и связанных с ними лучших практик:
Ключевые лучшие практики для настройки проверки здоровья в Global Accelerator
1. Используйте соответствующие протоколы проверки здоровья и порты
- Выберите протокол проверки здоровья (TCP, HTTP или HTTPS), который наилучшим образом отражает характер вашего приложения и способность конечной точки отвечать. Проверки медицинского обслуживания TCP проверяют подключение на уровне сети путем отправки пакетов SYN, в то время как проверки HTTP/HTTPS моделируют фактические запросы на http get на конечные точки приложения [6] [9].
- Настройте порт проверки здоровья в соответствии с портом прослушивателя на вашем ускорителе для согласованности. Если вы используете другой порт для проверки медицинских услуг, убедитесь, что правила брандмауэра и группы безопасности ограничивают доступ только к IP -диапазонам, используемым на маршруте 53 Checkers, чтобы предотвратить публичное обнаружение порта [1] [4].
- Для экземпляров EC2 или упругих конечных точек IP со слушателями UDP Global Accelerator выполняет проверки здоровья TCP в порте слушателя, поэтому убедитесь, что TCP -сервер работает на этом порте; В противном случае конечные точки будут отмечены нездоровыми [1].
2. Обеспечить безопасность и доступ для проверки здоровья
- Разрешить входящий трафик с IP -адресов, связанных с Amazon Route 53 Checkers в конфигурациях брандмауэра и маршрутизатора. Это важно для успешных проверок здоровья, особенно для экземпляра EC2 или эластичных конечных точек IP [1] [4].
- При использовании не деко-по умолчаний порт проверки здоровья ограничивает доступ к этому порту только к диапазонам IP-диапазонов Health Route 53, чтобы избежать рисков безопасности [1].
- Регулярно просмотреть и обновлять правила группы безопасности для размещения любых изменений в диапазонах IP -адресов, используемых на шашках Health Route 53.
3. Настройка проверки здоровья параметры вдумчиво
- Установите интервал проверки здоровья (время между чеками) на основе толерантности вашего приложения к времени простоя и критичности конечной точки. Более короткие интервалы обнаруживают сбои быстрее, но увеличивают нагрузку и стоимость, в то время как более длительные интервалы уменьшают нагрузку, но обнаружение сбоев задержки [5].
- Настройте пороговое количество (количество последовательных успехов или сбоев, прежде чем изменить состояние здоровья конечной точки), чтобы сбалансировать чувствительность и стабильность. Общее дефолт-3, что обеспечивает хороший компромисс между ложными срабатыванием и скоростью обнаружения [1] [9].
- Используйте значения тайм -аута по умолчанию, если у вас нет конкретных причин для их скорректировки. Например, тайм -аут проверки здоровья TCP фиксируется через 3 секунды в глобальном ускорителе [6].
4. Согласовать проверки здоровья с типами конечных точек
- Для конечных точек балансировщика сетевой нагрузки (NLB) или балансировщика нагрузки приложений (ALB) настройте проверки здоровья на самом балансировщике нагрузки, а не в глобальном ускорителе, поскольку глобальный ускоритель использует состояние здоровья балансировщика нагрузки для определения здоровья конечной точки [1].
- Для экземпляров EC2 или упругих IP -адресов настраивайте проверки здоровья непосредственно в глобальном ускорителе, указав соответствующие порты и протоколы, которые отражают фактическую доступность услуг [1].
5. Используйте значимые пути проверки здоровья для HTTP/https
- При использовании проверки HTTP или HTTPS Health укажите путь URI, который точно представляет здоровье вашего приложения (например, выделенная конечная точка для проверки здоровья, а не домашнюю страницу). Это гарантирует, что проверка здоровья отражает готовность на уровне приложений, а не только доступность сети [6].
- Держите путь URI кратким и достоверным, начиная с прямой черты и содержащей допустимые символы [6].
6. Мониторинг показателей проверки здоровья и журналов
- Регулярно просматривайте результаты проверки здоровья и метрики CloudWatch, чтобы определить шаблоны или повторяющиеся сбои. Это помогает в упреждающем устранении неполадок и планировании пропускной способности [5].
- Настройте тревоги CloudWatch, чтобы немедленно уведомить вашу команду, когда конечные точки становятся нездоровыми или выздоравливающими, что обеспечивает быстрый ответ на инциденты [5].
7. Реализовать стратегии отказа и восстановления
- Используйте способность Global Accelerator направлять трафик только для здоровых конечных точек для мгновенного переключения.
- Тестируйте сценарии отказоустойчивости и отказоустойчивости, чтобы обеспечить плавные переходы трафика во время отключений конечной точки и восстановления [5] [8].
8. Держите проверку здоровья обновленными
- Периодически просмотреть и обновлять конфигурации проверки здоровья по мере развития вашего приложения, включая изменения в портах, протоколах или пути проверки здоровья.
- Удалить проверки здоровья на наличие конечных точек, которые больше не используются, чтобы избежать ненужного мониторинга и потенциального воздействия безопасности [5].
Следуя этой лучшей практике, вы гарантируете, что глобальные проверки здоровья ускорителя предоставляют точную, безопасную и своевременную информацию о здоровье конечной точки, что обеспечивает надежную маршрутизацию трафика и высокую доступность для ваших приложений.
Цитаты:
[1] https://docs.aws.amazon.com/global-ccelerator/latest/dg/about-endpoint-groups-chealth-check-options.html
[2] https://aws.amazon.com/blogs/networking-and-content-delivery/best-practices-for-deployment-with-aws-global-ccelerator/
[3] https://docs.aws.amazon.com/global-ccelerator/latest/dg/introduction-how-it-works.html
[4] https://repost.aws/knowledge-center/global-ccelerator-unhealthy-endpoints
[5] https://docs.aws.amazon.com/route53/latest/developerguide/best-practices-healthchecks.html
[6] https://www.alibabacloud.com/help/en/ga/user-guide/enable-and-danage-health-ceecks
[7] https://support.huaweicloud.com/intl/en-us/usermanual-ga/ga_03_5002.html
[8] https://tutorialsdojo.com/aws-global-ccelerator/
[9] https://boto3.amazonaws.com/v1/documentation/api/1.16.27/reference/services/globalaccelerator.html