Пост по заданию из курса "Системной инженерии": реферат по hyperautomation. Для рассмотрения беру один из технических доменов, с которыми работаю: телекоммуникационные сети.
Введение
Рынок сетевой автоматизация растет на протяжении многих лет. Исследования сообщают, что он будет продолжать расти в среднем на 22,8% в период с 2021 по 2028 год. Причина в том, что при возрастающей сложности сетей именно автоматизация помогает удерживать характеристики гибкости и надежности на необходимых уровнях.
В этом посте:
- рассматриваю, что включает в себя сетевая автоматизация и что она дает организациям;
- привожу пять уровней зрелости автоматизации организации;
- упоминаю различные типы инструментов, используемых предприятиями;
- представляю тенденции рынка автоматизации;
- описываю, как структурирован типичный документ сетевой стратегии;
- оцениваю перспективы сетевой автоматизации в моей отрасли.
Так как весь текст в этом блоге, кроме последнего раздела, это попытка изложить переводной материал своими словами, стиль написания основной части и вывода могут отличаться.
Что такое сетевая автоматизация?
Сетевая автоматизация - процесс автоматизации развертывания, настройки, тестирования/проверки и эксплуатации сетевых устройств, которые могут быть физическими (маршрутизаторы, коммутаторы, точки доступа, сетевые экраны и т. д.) или виртуальными (облака, виртуальные машины, контейнеры).
Автоматизация применяется к таким сетевым сервисам, как:
- Сети ЦОДов,
- Облачные сервисы,
- Кампусные сети и сети OT (операционные технологии),
- Граничная инфраструктура WAN.
Стратегия сетевой автоматизации обычно включает в себя:
- разработку видения,
- постановку целей и задач,
- определение тактики для достижения целей и
- мобилизацию ресурсов для выполнения.
В сетевой автоматизации, виртуализации и облаках часто используют концепцию жизненого цикла управления сетью Day-N:
Network Functions Lifecycle Management (LCM)Сетевая автоматизация распространяется на все время эксплуатации системы, включая подключение к сети в День 0, настройку в День 1 и эксплуатацию и оптимизацию во День 2:
- День 0. Автоматическое развертывание сетевых устройств (plug&play).
- День 1. Настройка и управление сетью с использованием шаблонов, определенных инженерами или преднастроенных на сетевом контроллере. Настройка сегментации сети на основе аналитики поведения трафика.
- День 2: Обновления/изменения конфигурации сети. Выявление и устранение уязвимостей безопасности на основе AI/ML. Планирование мощностей. Управление жизненным циклом аппаратного и программного обеспечения.
Преимущества сетевой автоматизации
Пишут, что до 95% изменений в сети сегодня выполняются вручную. Это часто приводит к несогласованностям и конфликтующим конфигурациям. Такие несоответствия приводят к простоям, снижению скорости обслуживания и увеличению эксплуатационных расходов.
Сетевая автоматизация может устранить вышеуказанные недостатки, предлагая:
- Оперативное реагирование на новые требования. Автоматизация позволяет снизить эксплуатационные расходы, повысить уровень обслуживания и быстрее реагировать на изменение потребностей.
- Повышение надежности. Автоматизация уменьшает риск человеческого фактора и необязательных ошибок. В результате улучшается доступность сети.
- Сокращение операционных расходов. Автоматизация помогает сократить операционные расходы, устраняя ручные, трудоемкие и повторяющиеся задачи.
- Стандартизированные конфигурации. Для достижения эффективности автоматизации в первую очередь необходимо стандартизировать шаблоны конфигурации.
- Более быстрые изменения в сети: время применения изменений в сети сокращается, когда задачи выполняются и проверяются программно, а не оператором сети вручную.
- Упрощенное удаленное управление. Контроллеры сетевой автоматизации оптимизированы для администрирования через удаленный доступ.
Кроме того, высокоуровневые технологии автоматизации, такие как самоуправляемые (self-driving) сети, предоставляют функции:
- AI, искусственного интеллекта: постоянная оценка собираемых данных с детекцией отклонений.
- Динамическую оптимизацию: использование машинного обучения (ML) для поддержания оптимального состояния сети.
- Упрощенный поиск ошибок/траблшутинг: модели машинного обучения находят отклонения и аномалии по сравнению с базовым поведением сети.
- Лучшее понимание состояния сети: инструменты автоматизации сети, такие как сетевые контроллеры, улучшают видимость вашей инфраструктуры и предоставляют детализированную информацию о состояния сети.
- Повышенная безопасность: уменьшиется количество направлений атаки с помощью микросегментации на основе AI/ML, возможно также автоматизированное обеспечение комплаенса/compliance.
Концепция самоуправляемой сети / Self-Driving Network, придуманная Juniper Networks, описывает сочетание телеметрии, автоматизации рабочих процессов, DevOps и машинного обучения для создания отзвчивой, адаптивной и прогнозируемой инфраструктуры.
Сети сложны, и эта сложность имеет два основных последствия. Во-первых, для создания, эксплуатации и управления традиционной сетью требуется команда сертифицированных специалистов, чья работа требует огромных трудозатрат. Во-вторых, из-за своей сложности сети часто бывают хрупкими и нетерпимыми к изменениям.
Цель самоуправляемой сети - уменьшить количество конфликтов, связанных с внесением изменений. Это дает двойную выгоду: ускорение операций и снижение хрупкости.
Дорожная карта для самоуправляемых сетейИнтересный инструмент цифрового двойника сети Digital Twin предлагает Extreme Networks как часть своего продукта IQ CoPilot. Технология цифровых двойников в сети позволит:
- Попробовавать варианты настройки. Можно протестировать различные сценарии, которые могут произойти при развертывании нового устройства. Это поможет заблаговременно создать работающий план развертывания с учетом всех необходимых изменений.
- Уменьшить риск простоя сети. Увидеть, что может пойти не так, разработать лучший план и понять, как смягчить потенциальные проблемы, прежде чем они смогут повлиять на существующую сеть.
- Проводить безшовное развертывание. Когда есть план и готовы конфигурации сеть готова к беспрепятственной интеграции нового устройства с минимальными перерывами в работе!
Инструменты автоматизации сети
Из-за широкого спектра вариантов использования сетевой автоматизации не существует единого инструмента, который мог бы решить все из них. Есть ландшафт инструментов с открытым исходным кодом и инструментов вендоров, которые удовлетворяют различные потребности, которые дополняют друг друга и часто также пересекаются друг с другом.
Некоторые из самых инструментов: Terraform, Ansible, Chef, Kibana, Grafana, Splunk и Python. Большинство - не готовые инструменты, а скорее конструкторы, которые можно (и нужно) адаптировать к конкретному применению.
Кроме того, существуют программно-определяемые сети, представляющих собой архитектуры, с раздельными плоскостями данных и управления (data/control plane). В такой сети за интеллектуальные функции, включая автоматизицию, отвечает отдельное устройство - сетевой контроллер.
Автоматизация также часто подразумевает использование AIOps — искусственного интеллекта для ИТ-операций. AIOps анализирует данные в режиме реального времени и автоматически исправляет проблемы сети до того, как они заметно повлияют на ее характеристики.
Эффективнгость применения AIOps к сетевым операциям по данным Cisco SystemsУровень зрелости сетевой автоматизации
Уровени зрелости сетевой автоматизации в организации, по возрастанию:
- Ручная настройка устройств. Сеть по-прежнему использует ручное развертывание и настройку для каждого устройства через интерфейс командной строки или SNMP.
- Автоматизация базовой конфигурации. Существует некоторая базовая автоматизация конфигурации образов и устройств.
- Автоматическое развертование в домене на основе контроллера. Обеспечивает безопасную, масштабируемую и согласованную подготовку нулевого и первого дней.
- Автоматическая инициализация всей сети на основе контроллера. В сети уже реализована автоматизация на основе контроллера для предоставления и настройки на основе политик дня 0 и дня 1. Развернут инструмент оркестрации служб, обеспечивающий сквозную оркестрацию.
- Автоматическое развертывание устройств в самоорганизующейся, самодиагностируемой и динамически обновляемой сети. Сеть обладает расширенными возможностями самооптимизации благодаря внедрению автоматизации дней 0, 1 и 2 на основе политик машинного обучения на AIOps технологиях.
Тенденции автоматизации и оркестрации ИТ на предприятии
Gartner в своих продающихся за деньги отчетах пишет, что инструменты сетевой автоматизации и оркестрации переходят от нишевых применений, используемых отдельными сотрудниками, к предоставлению динамичных решений, которые позволяют все больше автоматизировать сетевые операции.
Согласно Gartner, гиперавтоматизация - это подход к управлению бизнесом, который позволяет быстро автоматизировать большое количество бизнес-процессов и ИТ-процессов, включая сетевую автоматизацию. Организации, которые сопротивляются давлению на автоматизацию, могут оставаться неконкурентоспособными.
Рекомендации Gartner для руководителей, отвечающих за управление сетевой инфраструктурой, гласят:
- Обеспечьте повышенную гибкость сети для поддержки организационных требований. Для этого необходимо сконцентрироваться на автоматизации и оркестровке сети, а также измерять соответствующие бизнес-результаты.
- Ускорите переход к автоматизации/организации, выявив необходимые проблемы культуры и навыки, связанные с оркестровкой, которых нет в организации. Выберите поставщиков, которые помогут заполнить эти пробелы, и скорректируйте схемы обучения и найма.
- Ускорьте внедрение цифровых и облачных технологий, рассматривая сетевую автоматизацию и оркестровку как стратегический приоритет, и соответственно инвестируйте в персонал и инструменты.
- Совершенствуйте инициативы по автоматизации и оркестровке, внедряя дополнительные инструменты и управляя ими таким образом, чтобы достичь универсальных операций ввода-вывода. Это приведет к совершенствованию цифровой деятельности с помощью AIOps.
Аналогичным образом, IDC рекомендует внедрять более высокие уровни автоматизации сети для повышения гибкости, внедрения инноваций, повышения качества обслуживания клиентов, а также повышения производительности и расширения выпуска продукции. Например, прогнозируется, что повышение уровня с 3 до 4 — в соответствии с вышеупомянутыми уровнями зрелости — сократит время выхода нового продукта на рынок на 40% и повысит производительность критически важных приложений на 22% .
План реализации
План реализации - документ, в котором описываются рабочие потоки, задачи, даты начала и окончания, оценка трудозатрат, владельцы задач и зависимости.
Дорожная карта стратегии автоматизацииЛучшие практики для планирования автоматизации не сильно отличаются от таковых при внедерии любого нового процесса:
- Определить приоритеты вариантов использования, которые необходимо автоматизировать, учитывая влияние на бизнес, а также сложность реализации.
- Зафиксировать требования вариантов использования для нескольких пользователей и организаций (например, планирование, разработка, эксплуатация, безопасность).
- Запланировать развертывание решений с использованием инструментов и процессов Agile и CI/CD.
- Использовать автоматические тесы для сквозного тестирования (включая пользовательский интерфейс, автоматизацию процессов, конфигурацию устройств) и тестирования архитектурных характеристик.
Примерами ключевых показателей эффективности могут быть: «общее количество сетевых устройств, управляемых программно-определяемым сетевым контроллером», «количество вариантов использования сети, разработанных в инструменте оркестровки служб» или «количество сетевых проблем, решенных с помощью AIOps и автоматизации с обратной связью».
Разумеется, как и при реализации/совершенствовании любого другого процесса внутри организации, надо держать во внимании и прорабатывать: существующие технологии, организационную структуру, культуру, компетенции персонала, все осталные зависимости. Должно работать управление конфигурацией. Стратегия автоматизации сети должна отражать общую бизнес-стратегию, однако и на нее влияют уже существующие стратегии в отношении данных, безопасности или финансирования
Выводы
В книге "Team Topologies: Organizing Business and Technology Teams for Fast Flow" описывается такой тип команды, как платформенная, platform team. Задача этой команды - снижать когнитивную нагрузку для продуктовых команд, работающих в потоке. То есть платформенная команда предоставляет легко потребляемые сервисы по оговоренному соглашению/контракту, не отвлекая тех, кто зарабатывает деньги, от их прямых обязанностей.
Именно так, как платформу, снижающую когнитивную нагрузку для бизнеса, подают и продают вендоры свои решения для автоматизации сетей. Кстати, та же модель, что у облачных провайдеров ИТ-сервисов. Вам, говорят, ни о чем не надо думать, все произойдет ав-то-ма-ти-чес-ки. Выглядит замечательно.
Рассмотрим отрасль, где работают мои целевые системы - телеком для нефтегазовой и горнодобывающей отраслей промышленности. Конфликты, противоречия и неустроенности, когда думаем о сетевой автоматизации: консерватизм отрасли, линейное масштабирование, финансовая составляющая.
В локальных сетях, по слухам, еще работают сетевые хабы/концетраторы, произведенные в 90-х годах прошлого века. Хабов уже сам не видел давно, но 20-летний коммутатор уровня доступа - обычное дело. 100-мегабитный ethernet порт для многих устройств и даже рабочих станций - норм и ок. 1 гигабит - хайтек. Чтобы развернуть сетевую автоматизацию во всей сети сразу (а иначе зачем), надо заменять или логически изолировать все старое оборудование. То есть основательно ломать над проектом бесшовной модернизации голову (когнитивная нагрузка!) и тратить деньги. Зачем? Все и так работает.
Но организация все-таки меняется и растет. Все-таки часто возникают ограничения в сети, которые надо устранять. Все просто - покупаем оборудование с like-to-like превосходящими характеристиками (скорость портов, пропускная способность матрицы коммутации, память) и ставим на место устаревшего. В 80% случаев такой подход работает. Пакеты будут ходить, control plane/плоскость управления отработает, сходимость сети не ухудшится. Выручает тот самый консерватизм отрасли- интернет придумали 60 лет назад, ровно сорок лет назад, 1 января 1983 года, ARPANET перешел на стек протоколов TCP/IP. Все brownfield сети живут на такой ползучей модернизации.
Представим, что все-таки требуется развернуть новый greenfield проект или есть средства на полную модернизацию сети. Заманчиво проектировать сеть сразу с учетом автоматизации. Есть только одно "но": для вендоров автоматизация - повод перевести заказчика на подписочную модель. То есть все будет работать так, как заявлено, только если оплачивается ежегодная подписка с учетом количества устройств. Да, после непродления подписки базовый сетевой функционал, скорее всего, не исчезнет, но... фрустрация и ощущение песка между пальцами. Вспомним 20-летний коммутатор двумя абзацами выше: на нем вендор заработал один раз, 20 назад. А вот если бы тогда его продали с подпиской, то он продолжал бы приносить прибыль производителю до сих пор. Многим лицам, принимающим решения у заказчиков, кажется, что лучше заплатить один раз и не возвращаться к этому вопросу. Сюда же - риск привязки к решением одного вендора "Vendor King", как описано в этом посте.
Однако, если бы можно было сделать ставки, то я бы поставил на вендров.
- Во-первых, довод, с которого начинался пост - сложность сетей так или иначе растет, и поддерживать архитектурные характеристики вручную становится все сложнее.
- Во-вторых, есть направления, где без сетевой автоматизации уже сейчас никуда. Это, к примеру, беспроводные сети и информационная безопасность сети. Даже самые консервативные клиенты приобретают контроллеры беспроводных сетей и покупают подписки на системы управления сетевым доступом.
- В-третьих, новое "железо" уже сложно найти сейчас поставляемого по умолчанию "бесплатного приложения" - подписки на средства сетевой автоматизации. И пусть не каждый заказчик пока этим пользуется, но критическая масса устройств в сети, поддерживающих автоматизацию, постепенно растет. Не удивлюсь, если они начнут самоорганизовываться в сети без ведома человеков.