Автоматизируй Это

Пост по заданию из курса "Системной инженерии": реферат по hyperautomation. Для рассмотрения беру один из технических доменов, с которыми работаю: телекоммуникационные сети.

Введение

Рынок сетевой автоматизация растет на протяжении многих лет. Исследования сообщают, что он будет продолжать расти в среднем на 22,8% в период с 2021 по 2028 год. Причина в том, что при возрастающей сложности сетей именно автоматизация помогает удерживать характеристики гибкости и надежности на необходимых уровнях.

В этом посте:

  • рассматриваю, что включает в себя сетевая автоматизация и что она дает организациям;
  • привожу пять уровней зрелости автоматизации организации;
  • упоминаю различные типы инструментов, используемых предприятиями;
  • представляю тенденции рынка автоматизации;
  • описываю, как структурирован типичный документ сетевой стратегии;
  • оцениваю перспективы сетевой автоматизации в моей отрасли.

Так как весь текст в этом блоге, кроме последнего раздела, это попытка изложить переводной материал своими словами, стиль написания основной части и вывода могут отличаться.

Что такое сетевая автоматизация?

Сетевая автоматизация - процесс автоматизации развертывания, настройки, тестирования/проверки и эксплуатации сетевых устройств, которые могут быть физическими (маршрутизаторы, коммутаторы, точки доступа, сетевые экраны и т. д.) или виртуальными (облака, виртуальные машины, контейнеры).

Автоматизация применяется к таким сетевым сервисам, как:

  • Сети ЦОДов,
  • Облачные сервисы,
  • Кампусные сети и сети OT (операционные технологии),
  • Граничная инфраструктура WAN.

Стратегия сетевой автоматизации обычно включает в себя:

  1. разработку видения,
  2. постановку целей и задач,
  3. определение тактики для достижения целей и
  4. мобилизацию ресурсов для выполнения.

В сетевой автоматизации, виртуализации и облаках часто используют концепцию жизненого цикла управления сетью Day-N:

Network Functions Lifecycle Management (LCM)

Сетевая автоматизация распространяется на все время эксплуатации системы, включая подключение к сети в День 0, настройку в День 1 и эксплуатацию и оптимизацию во День 2:

  • День 0. Автоматическое развертывание сетевых устройств (plug&play).
  • День 1. Настройка и управление сетью с использованием шаблонов, определенных инженерами или преднастроенных на сетевом контроллере. Настройка сегментации сети на основе аналитики поведения трафика.
  • День 2: Обновления/изменения конфигурации сети. Выявление и устранение уязвимостей безопасности на основе AI/ML. Планирование мощностей. Управление жизненным циклом аппаратного и программного обеспечения.

Преимущества сетевой автоматизации

Пишут, что до 95% изменений в сети сегодня выполняются вручную. Это часто приводит к несогласованностям и конфликтующим конфигурациям. Такие несоответствия приводят к простоям, снижению скорости обслуживания и увеличению эксплуатационных расходов.

Сетевая автоматизация может устранить вышеуказанные недостатки, предлагая:

  • Оперативное реагирование на новые требования. Автоматизация позволяет снизить эксплуатационные расходы, повысить уровень обслуживания и быстрее реагировать на изменение потребностей.
  • Повышение надежности. Автоматизация уменьшает риск человеческого фактора и необязательных ошибок. В результате улучшается доступность сети.
  • Сокращение операционных расходов. Автоматизация помогает сократить операционные расходы, устраняя ручные, трудоемкие и повторяющиеся задачи.
  • Стандартизированные конфигурации. Для достижения эффективности автоматизации в первую очередь необходимо стандартизировать шаблоны конфигурации.
  • Более быстрые изменения в сети: время применения изменений в сети сокращается, когда задачи выполняются и проверяются программно, а не оператором сети вручную.
  • Упрощенное удаленное управление. Контроллеры сетевой автоматизации оптимизированы для администрирования через удаленный доступ.

Кроме того, высокоуровневые технологии автоматизации, такие как самоуправляемые (self-driving) сети, предоставляют функции:

  • AI, искусственного интеллекта: постоянная оценка собираемых данных с детекцией отклонений.
  • Динамическую оптимизацию: использование машинного обучения (ML) для поддержания оптимального состояния сети.
  • Упрощенный поиск ошибок/траблшутинг: модели машинного обучения находят отклонения и аномалии по сравнению с базовым поведением сети.
  • Лучшее понимание состояния сети: инструменты автоматизации сети, такие как сетевые контроллеры, улучшают видимость вашей инфраструктуры и предоставляют детализированную информацию о состояния сети.
  • Повышенная безопасность: уменьшиется количество направлений атаки с помощью микросегментации на основе AI/ML, возможно также автоматизированное обеспечение комплаенса/compliance.

Концепция самоуправляемой сети / Self-Driving Network, придуманная Juniper Networks, описывает сочетание телеметрии, автоматизации рабочих процессов, DevOps и машинного обучения для создания отзвчивой, адаптивной и прогнозируемой инфраструктуры.

Сети сложны, и эта сложность имеет два основных последствия. Во-первых, для создания, эксплуатации и управления традиционной сетью требуется команда сертифицированных специалистов, чья работа требует огромных трудозатрат. Во-вторых, из-за своей сложности сети часто бывают хрупкими и нетерпимыми к изменениям.

Цель самоуправляемой сети - уменьшить количество конфликтов, связанных с внесением изменений. Это дает двойную выгоду: ускорение операций и снижение хрупкости.

Дорожная карта для самоуправляемых сетей

Интересный инструмент цифрового двойника сети Digital Twin предлагает Extreme Networks как часть своего продукта IQ CoPilot. Технология цифровых двойников в сети позволит:

  • Попробовавать варианты настройки. Можно протестировать различные сценарии, которые могут произойти при развертывании нового устройства. Это поможет заблаговременно создать работающий план развертывания с учетом всех необходимых изменений.
  • Уменьшить риск простоя сети. Увидеть, что может пойти не так, разработать лучший план и понять, как смягчить потенциальные проблемы, прежде чем они смогут повлиять на существующую сеть.
  • Проводить безшовное развертывание. Когда есть план и готовы конфигурации сеть готова к беспрепятственной интеграции нового устройства с минимальными перерывами в работе!
Сценарии для цифрового двойника сети от Extreme Networks

Инструменты автоматизации сети

Из-за широкого спектра вариантов использования сетевой автоматизации не существует единого инструмента, который мог бы решить все из них. Есть ландшафт инструментов с открытым исходным кодом и инструментов вендоров, которые удовлетворяют различные потребности, которые дополняют друг друга и часто также пересекаются друг с другом.

Некоторые из самых инструментов: Terraform, Ansible, Chef, Kibana, Grafana, Splunk и Python. Большинство - не готовые инструменты, а скорее конструкторы, которые можно (и нужно) адаптировать к конкретному применению.

Кроме того, существуют программно-определяемые сети, представляющих собой архитектуры, с раздельными плоскостями данных и управления (data/control plane). В такой сети за интеллектуальные функции, включая автоматизицию, отвечает отдельное устройство - сетевой контроллер. 

Автоматизация также часто подразумевает использование AIOps — искусственного интеллекта для ИТ-операций. AIOps анализирует данные в режиме реального времени и автоматически исправляет проблемы сети до того, как они заметно повлияют на ее характеристики.

Эффективнгость применения AIOps к сетевым операциям по данным Cisco Systems

Уровень зрелости сетевой автоматизации

Уровени зрелости сетевой автоматизации в организации, по возрастанию:

  1. Ручная настройка устройств. Сеть по-прежнему использует ручное развертывание и настройку для каждого устройства через интерфейс командной строки или SNMP.
  2. Автоматизация базовой конфигурации. Существует некоторая базовая автоматизация конфигурации образов и устройств.
  3. Автоматическое развертование в домене на основе контроллера. Обеспечивает безопасную, масштабируемую и согласованную подготовку нулевого и первого дней.
  4. Автоматическая инициализация всей сети на основе контроллера. В сети уже реализована автоматизация на основе контроллера для предоставления и настройки на основе политик дня 0 и дня 1. Развернут инструмент оркестрации служб, обеспечивающий сквозную оркестрацию.
  5. Автоматическое развертывание устройств в самоорганизующейся, самодиагностируемой и динамически обновляемой сети. Сеть обладает расширенными возможностями самооптимизации благодаря внедрению автоматизации дней 0, 1 и 2 на основе политик машинного обучения на AIOps технологиях.

Тенденции автоматизации и оркестрации ИТ на предприятии

Gartner в своих продающихся за деньги отчетах пишет, что инструменты сетевой автоматизации и оркестрации переходят от нишевых применений, используемых отдельными сотрудниками, к предоставлению динамичных решений, которые позволяют все больше автоматизировать сетевые операции. 

Согласно Gartner, гиперавтоматизация - это подход к управлению бизнесом, который позволяет быстро автоматизировать большое количество бизнес-процессов и ИТ-процессов, включая сетевую автоматизацию. Организации, которые сопротивляются давлению на автоматизацию, могут оставаться неконкурентоспособными.

Рекомендации Gartner для руководителей, отвечающих за управление сетевой инфраструктурой, гласят:

  • Обеспечьте повышенную гибкость сети для поддержки организационных требований. Для этого необходимо сконцентрироваться на автоматизации и оркестровке сети, а также измерять соответствующие бизнес-результаты.
  • Ускорите переход к автоматизации/организации, выявив необходимые проблемы культуры и навыки, связанные с оркестровкой, которых нет в организации. Выберите поставщиков, которые помогут заполнить эти пробелы, и скорректируйте схемы обучения и найма.
  • Ускорьте внедрение цифровых и облачных технологий, рассматривая сетевую автоматизацию и оркестровку как стратегический приоритет, и соответственно инвестируйте в персонал и инструменты.
  • Совершенствуйте инициативы по автоматизации и оркестровке, внедряя дополнительные инструменты и управляя ими таким образом, чтобы достичь универсальных операций ввода-вывода. Это приведет к совершенствованию цифровой деятельности с помощью AIOps.

Аналогичным образом, IDC рекомендует внедрять более высокие уровни автоматизации сети для повышения гибкости, внедрения инноваций, повышения качества обслуживания клиентов, а также повышения производительности и расширения выпуска продукции. Например, прогнозируется, что повышение уровня с 3 до 4 — в соответствии с вышеупомянутыми уровнями зрелости — сократит время выхода нового продукта на рынок на 40% и повысит производительность критически важных приложений на 22% .

План реализации

План реализации - документ, в котором описываются рабочие потоки, задачи, даты начала и окончания, оценка трудозатрат, владельцы задач и зависимости. 

Дорожная карта стратегии автоматизации

Лучшие практики для планирования автоматизации не сильно отличаются от таковых при внедерии любого нового процесса:

  • Определить приоритеты вариантов использования, которые необходимо автоматизировать, учитывая влияние на бизнес, а также сложность реализации.
  • Зафиксировать требования вариантов использования для нескольких пользователей и организаций (например, планирование, разработка, эксплуатация, безопасность).
  • Запланировать развертывание решений с использованием инструментов и процессов Agile и CI/CD.
  • Использовать автоматические тесы для сквозного тестирования (включая пользовательский интерфейс, автоматизацию процессов, конфигурацию устройств) и тестирования архитектурных характеристик.

Примерами ключевых показателей эффективности могут быть: «общее количество сетевых устройств, управляемых программно-определяемым сетевым контроллером», «количество вариантов использования сети, разработанных в инструменте оркестровки служб» или «количество сетевых проблем, решенных с помощью AIOps и автоматизации с обратной связью».

Разумеется, как и при реализации/совершенствовании любого другого процесса внутри организации, надо держать во внимании и прорабатывать: существующие технологии, организационную структуру, культуру, компетенции персонала, все осталные зависимости. Должно работать управление конфигурацией. Стратегия автоматизации сети должна отражать общую бизнес-стратегию, однако и на нее влияют уже существующие стратегии в отношении данных, безопасности или финансирования

Выводы

В книге "Team Topologies: Organizing Business and Technology Teams for Fast Flow" описывается такой тип команды, как платформенная, platform team. Задача этой команды - снижать когнитивную нагрузку для продуктовых команд, работающих в потоке. То есть платформенная команда предоставляет легко потребляемые сервисы по оговоренному соглашению/контракту, не отвлекая тех, кто зарабатывает деньги, от их прямых обязанностей.

Именно так, как платформу, снижающую когнитивную нагрузку для бизнеса, подают и продают вендоры свои решения для автоматизации сетей. Кстати, та же модель, что у облачных провайдеров ИТ-сервисов. Вам, говорят, ни о чем не надо думать, все произойдет ав-то-ма-ти-чес-ки. Выглядит замечательно.

Рассмотрим отрасль, где работают мои целевые системы - телеком для нефтегазовой и горнодобывающей отраслей промышленности. Конфликты, противоречия и неустроенности, когда думаем о сетевой автоматизации: консерватизм отрасли, линейное масштабирование, финансовая составляющая.

В локальных сетях, по слухам, еще работают сетевые хабы/концетраторы, произведенные в 90-х годах прошлого века. Хабов уже сам не видел давно, но 20-летний коммутатор уровня доступа - обычное дело. 100-мегабитный ethernet порт для многих устройств и даже рабочих станций - норм и ок. 1 гигабит - хайтек. Чтобы развернуть сетевую автоматизацию во всей сети сразу (а иначе зачем), надо заменять или логически изолировать все старое оборудование. То есть основательно ломать над проектом бесшовной модернизации голову (когнитивная нагрузка!) и тратить деньги. Зачем? Все и так работает.

Но организация все-таки меняется и растет. Все-таки часто возникают ограничения в сети, которые надо устранять. Все просто - покупаем оборудование с like-to-like превосходящими характеристиками (скорость портов, пропускная способность матрицы коммутации, память) и ставим на место устаревшего. В 80% случаев такой подход работает. Пакеты будут ходить, control plane/плоскость управления отработает, сходимость сети не ухудшится. Выручает тот самый консерватизм отрасли- интернет придумали 60 лет назад, ровно сорок лет назад, 1 января 1983 года, ARPANET перешел на стек протоколов TCP/IP. Все brownfield сети живут на такой ползучей модернизации.

Представим, что все-таки требуется развернуть новый greenfield проект или есть средства на полную модернизацию сети. Заманчиво проектировать сеть сразу с учетом автоматизации. Есть только одно "но": для вендоров автоматизация - повод перевести заказчика на подписочную модель. То есть все будет работать так, как заявлено, только если оплачивается ежегодная подписка с учетом количества устройств. Да, после непродления подписки базовый сетевой функционал, скорее всего, не исчезнет, но... фрустрация и ощущение песка между пальцами. Вспомним 20-летний коммутатор двумя абзацами выше: на нем вендор заработал один раз, 20 назад. А вот если бы тогда его продали с подпиской, то он продолжал бы приносить прибыль производителю до сих пор. Многим лицам, принимающим решения у заказчиков, кажется, что лучше заплатить один раз и не возвращаться к этому вопросу. Сюда же - риск привязки к решением одного вендора "Vendor King", как описано в этом посте.

Однако, если бы можно было сделать ставки, то я бы поставил на вендров.

  • Во-первых, довод, с которого начинался пост - сложность сетей так или иначе растет, и поддерживать архитектурные характеристики вручную становится все сложнее.
  • Во-вторых, есть направления, где без сетевой автоматизации уже сейчас никуда. Это, к примеру, беспроводные сети и информационная безопасность сети. Даже самые консервативные клиенты приобретают контроллеры беспроводных сетей и покупают подписки на системы управления сетевым доступом.
  • В-третьих, новое "железо" уже сложно найти сейчас поставляемого по умолчанию "бесплатного приложения" - подписки на средства сетевой автоматизации. И пусть не каждый заказчик пока этим пользуется, но критическая масса устройств в сети, поддерживающих автоматизацию, постепенно растет. Не удивлюсь, если они начнут самоорганизовываться в сети без ведома человеков.

Источники:

  1. https://www.cisco.com
  2. https://www.juniper.net
  3. https://www.extremenetworks.com
  4. https://www.arubanetworks.com

Вчера вышел новый курс “Методология”. Там два интересных замечания, которые могут помочь улучшить обзор:
– концепция “жизненного цикла” как проведения чего-то однократного (скажем, “автоматизации как мероприятия на 4 месяца” ушла. Есть создание (выход MVP) и далее просто развитие системы, “непрерывное всё”.
– концепция “уровней зрелости” тоже ушла. поскольку фирмы считали, что они быстро поднялись на нужное число ступенек, и всё. Нет, оказалось, что там много лестниц, и у этих лестниц бесконечное число ступенек, а не заранее оговорённое.

И да, все эти изменения по факту означают на переход к другой модели работы: подписки на бесконечную разработку. Кончились подписки – кончились разработки. Ибо это ж software defined network, всё другое стало.

Будет интересно пересмотреть свой пост после того, как пройду новую “Методологию”. Ставлю себе закладку.