Intro
00:00:00Сердечное приветствие знакомит слушателей с понятием "Добро пожаловать". Сообщение подается непринужденным и дружелюбным тоном, для создания атмосферы используется простое "привет". Это привлекательное начало направлено на то, чтобы заинтересовать зрителей открытым и незамысловатым вступлением.
Introduction Background
00:00:13На сессии будет представлена двухуровневая стратегия, разработанная специально для поставщиков OpenStack и сочетающая абстрактные принципы проектирования с конкретными деталями реализации зон доступности. В руководящих принципах высокого уровня устанавливаются критерии и организационные методы для повышения устойчивости, в то время как анализ конкретных проектов позволяет решить практические проблемы при развертывании этих зон. Этот подход упрощает коммуникацию за счет использования буквы "AZ" в качестве сокращенного обозначения, обеспечивая ясность и эффективность на протяжении всего процесса планирования.
What is an AZ, and what benefit does it provide?
00:01:13Зона доступности - это выделенный для сбоев домен в облачном регионе, который изолирует уязвимости оборудования для защиты от сбоев. Структурируя ресурсы вокруг отдельных точек сбоя, будь то источники питания или отдельные серверные стойки, клиенты могут развертывать приложения в основных и резервных установках для обеспечения высокой доступности. Эта стратегия, разработанная на основе AWS и реализованная в OpenStack, гарантирует, что даже в случае сбоя в работе одной зоны другие смогут справиться с нагрузкой. Однако важно сбалансировать количество зон, поскольку их слишком много усложняет управление пропускной способностью для арендаторов.
What is the real value proposition for my AZS?
00:04:46Система AZS предназначена для ограничения сбоев в работе в пределах одной зоны доступности, что позволяет сдерживать сбои и повышать общую устойчивость. Однако частота и характер таких сбоев остаются неопределенными из-за ограниченности данных и проблем с тестированием. Многие центры обработки данных уже используют резервные источники питания и разнообразную проводку для предотвращения сбоев, что вызывает сомнения в том, что дополнительные механизмы изоляции принесут ощутимую пользу.
A better value proposition: Planned Maintenance
00:05:35Плановое техническое обслуживание в центрах обработки данных предполагает устранение сбоев, связанных с физическими нагрузками, такими как модернизация оборудования, прокладка серверных кабелей, работа систем кондиционирования и обновления программного обеспечения, такие как обновление ядра и исправление системы безопасности. Интеграция ACS может сократить время простоя, обеспечивая систематическое устранение этих частых сбоев. Необходима тщательная координация с командами центров обработки данных и хорошо отработанная стратегия обновления, основанная на физических границах, таких как помещения или этажи. Существующие ограничения платформы, такие как ограничения OpenStack, требуют согласованного определения зон доступности и стратегического планирования для устранения проблем изоляции.
Other uses for AZS
00:08:03Альтернативные варианты применения AZ и их недостатки Облачные операторы перепрофилируют зоны доступности, чтобы дифференцировать облачные функции, назначать варианты гипервизора или изолировать рабочие нагрузки клиентов, даже несмотря на то, что изначально AZ была спроектирована как область сбоев. Использование таких стратегий, как назначение определенных вычислительных узлов или предложение альтернативных типов виртуализации, отличается от целей, присущих AZ. Альтернативные механизмы, такие как метаданные изображений и фильтры хостинга, могут достичь этих целей без злоупотребления концепцией AZ. Такое неправильное применение приводит к осложнениям и не обеспечивает ожидаемый уровень изоляции или безопасности для пользователей.
Отображение и проблемы OpenStack AZs OpenStack реализует зоны доступности по-разному, что делает тщательное планирование необходимым для эффективного размещения рабочей нагрузки. В Nova каждый вычислительный агент назначается в зону доступа с помощью агрегатов узлов с выделенными метаданными, в то время как зоны по умолчанию и внутренние зоны определяют отдельные операционные роли. Система обеспечивает однозначное сопоставление хостов с AZ и включает такие параметры, как ограничения на подключение к другим AZ, чтобы предотвратить фрагментацию ресурсов. Точная настройка имеет решающее значение, поскольку перекрывающиеся домены или несогласованные настройки могут привести к конфликтам в расписании и снижению доступности рабочей нагрузки.
Cinder AZS-Basics
00:15:27Службы Cinder volume services привязаны к определенным зонам доступности, так что при создании тома назначенная для него зона доступа направляет его в соответствующую службу. Управление несколькими серверными системами, например, настройкой SSD-накопителя, осуществляется в пределах той же зоны доступа, что и служба управления томами. Вместо использования агрегатов узлов Nova, Cinder использует параметры конфигурации для определения этих зон, гарантируя отсутствие дублирования назначений. Последние обновления позволяют устанавливать зоны доступа на уровне серверной части хранилища, улучшая управление удаленными системами хранения.
Cinder- Default AZ
00:17:34Блочные тома хранилища группируются в одной зоне доступности, чтобы гарантировать, что они не будут работать одновременно, в соответствии со значениями вычислительной службы по умолчанию. Если в запросе API не указана зона доступности, система по умолчанию использует конфигурацию хранилища, а если она не задана, возвращается к жестко заданному значению. Это жестко заданное значение по умолчанию приведет к сбоям, если оно не соответствует существующей зоне. Установка четкого резервного варианта, например "AZ отсутствует", улучшает видимость журнала и предотвращает неравномерное распределение объема.
Cinder - Distributed storage backends
00:18:31Cinder использует встроенное резервирование в распределенных системах хранения данных, что во многих случаях делает ненужными многочисленные зоны доступности. Устройства хранения данных и системы, подобные SEF, часто охватывают все зоны, что позволяет обеспечить избыточность за пределами платформы OpenStack. Резервная опция разрешить доступ к зоне доступности облегчает создание тома в соответствии с ожиданиями шаблонов Nova и Heat. Этот подход предотвращает сбои API, когда сторонние библиотеки предполагают, что создание тома должно происходить в той же зоне, что и экземпляры Nova.
Neutron - DHCP Agent AZ
00:19:24В Neutron теперь используется драйвер AZ weight scheduler для распределения агентов DHCP и L3 по нескольким зонам доступности, что снижает риск одновременных сбоев. Ранее сети клиентов, размещенные на двух агентах DHCP, могли оказаться в одном и том же домене сбоев, что снижало устойчивость. В обновлении используются подсказки цепного планировщика для определения оптимальных зон доступности как для DHCP, так и для маршрутизаторов высокой доступности. Эта стратегия повышает общую надежность системы, обеспечивая различное размещение служб в разных областях сбоев.
Neutron - AZ assignments for agents
00:20:53Neutron настраивает назначение зон доступности с помощью настроек файла агента, гарантируя, что каждый агент принадлежит к одной непересекающейся зоне доступа, а не использует агрегаты узлов. При отсутствии конкретной информации применяется зона доступа по умолчанию, в то время как если не указать возможные зоны доступа, планировщик автоматически разнообразит размещение в сети. Адекватное распределение DHCP-агентов по всем AZ гарантирует сбалансированный сетевой хостинг, сокращая необходимость в явных подсказках для клиентов и упрощая настройку.
Neutron - Best Effort Scheduling
00:22:46Программа планирования наилучших результатов Neutron работает без явных указаний на размещение ресурсов, но это не гарантирует, что ресурсы будут размещены точно так, как задумано. Если агенты или службы доступа не работают или административно отключены, размещение может отличаться от запроса. Важно убедиться, что сети и маршрутизаторы были точно назначены для желаемых зон доступа после их создания. Кроме того, сеть назначается агенту только после создания подсети, что обеспечивает естественную контрольную точку для проверки.
Neutron - AZ Corner cases & limitations
00:23:28В обсуждении объясняется, что при подключении интерфейса маршрутизатора или настройке шлюза с маршрутизатором L3 зоны доступности применимы только к виртуальным машинам, использующим маршрутизатор Neutron. Сети провайдеров и конфигурации, такие как Neutron DVR с плавающими IP-адресами, не подпадают под действие этих настроек AZ. В нем указывается, что сервисы балансировки нагрузки, брандмауэра и VPN в настоящее время не поддерживают AZ, хотя в планах на будущее это планируется решить. В заключение в описании подчеркивается, что только подключаемые модули маршрутизаторов ML2 и L3 в настоящее время поддерживают расширение зон доступности, что подчеркивает необходимость более широкой поддержки подключаемых модулей.
Project comparison summary
00:24:17В ходе тщательного параллельного анализа contrail был оценен наряду с другими сторонними реализациями плагинов в течение трехдневного периода. В ходе анализа сравнивались каждый подход и выявлялись различия в интеграции и эффективности, хотя успех использования contrail оставался неубедительным. Были пересмотрены ключевые моменты внедрения, что позволило получить полезную информацию для принятия будущих решений по подключению плагинов.
Summary of the AZ Curse challenges
00:24:35Внедрение зон доступности требует четкой координации каждого уровня в стеке решений. Успех зависит от соответствия проекта требованиям конечного пользователя и тщательной оценки системных ограничений и реализаций, специфичных для конкретного проекта. Планирование надежных процедур обновления, изолированных простоев и управление физическим обслуживанием, таким как эвакуация серверов во время реконфигурации, обеспечивает стабильность работы. Стратегические архитектурные решения в области систем хранения данных и сетей позволяют сбалансировать производительность, плотность и доступность, предупреждая при этом возможные сбои оборудования.
Don't forget the cost-benefit analysis
00:26:24Внедрение ZZZ с помощью OpenStack требует четкого экономического обоснования, основанного на тщательном анализе затрат и выгод, а не произвольного использования технологии. Оценка потенциальных незапланированных сбоев и сценариев планового технического обслуживания необходима для оценки ее реальной ценности. Гибкая стратегия развертывания, такая как использование зон доступности с учетом потребностей клиентов, еще больше повышает ценность продуманного внедрения.