Использование «Toward a theory of evolution as multilevel learning» в рабочих проектах

ushelspat · 09.Июль.2024 17:43:30

Основные положения, которые вынес из статьи, следующие:

Обучение.
- Трактовка эволюции как накопление и переустройство знаний (в процессе обучения), т.е. возникновение и работа с памятью.
- Обучение и выживание сильно связаны, т.к. обучение дает возможность извлекать информацию из окружения для ее предсказания для выживания. А стабильность окружения нужно для возможности обучения.
- Чем быстрее изменения в мире, тем быстрее мы должны переучиваться и меняться. Система не может выжить в мире, где свойства окружения меняются быстрее чем система способна их выучивать.
Иерархическая сложность.
- Локальные оптимумы для единичной системы (на одном системном уровне) вызывают фрустрации при взаимодействии систем (поиск глобального оптимума).
- Функция потерь может быть использована как fitness function в контексте развития эволюции.
- Оптимизационные проблемы между уровнями порождают фрустрации, которые ведут к иерархической сложности систем.
7 принципов эволюции.
- Функция потерь уменьшается в процессе эволюции для всех эволюционирующих систем.
- Иерархия масштабов. В системе разные элементы эволюционируют на своей скорости в своем масштабе.
- Частотный разрыв между разными уровнями скоростями. Квантование.
- Описание быстроменяющихся переменных через более медленно меняющиеся переменные. Это и есть язык. Мы выбираем медленноменяющиеся переменные чтобы описывать быстроменяющиеся переменные. Это даёт нам мышление и развитие абстракций.
- Эволюционирующие системы как включают в себя части, так и исключают из себя части. Они объекты, представлены в 4d.
- Репликация и элиминация информации идет на каждом уровне.
- Информационный поток идет от более быстрых уровней в более медленные (сенсорный), а обратно управляющий поток (control) для предсказания состояния окружения и самой системы.

Сейчас это объяснение, кажется не полным и не точным, чем на момент первого прочтения статьи. Кажется более, полезным объяснения Chris Fields ActiveInferenceJournal/Courses/PhysicsAsInformationProcessing_ChrisFields at main · ActiveInferenceInstitute/ActiveInferenceJournal · GitHub

“https://www.youtube.com/watch?v=Xy3hmESLRtw”

Поэтому попробую сначала представления выше дополнить пониманием от Фильдса и Ко, а затем описать использование в контексте рабочего проекта.

Границы. Важное понятие граница системы, которое в статье Ванчурина и Ко не рассматривается, хотя уровни и фрустрации между уровнями подразумевают границы. Границы системы выделяются вниманием. Но это при рассмотрении, а при активном действии это Markov Blanket - статистически значимые отношения между нодами причинности.

Заданность внутренних (сенсорных, активных) и внешних (скрытых) состояний в рамках Markov blanket . Т.е. Markov blanket очерчивает границу нашего восприятия (сенсорного), которое влияет на нас, а также границу нашего активного контроля. Система имеет сенсорность от причин и передает активность следствиям. Технически это говорит о том, что внутренние состояния на границе Markov blanket условно независимы от внешних состояний.

Поскольку границы системы определяются каузально (граница нашего влияния), то другая система будет делать свой выбор и сочетания этих выборов ведет к фрустрациям (топологическим, временным и другим).

Если есть разделение внутри системы внутренними границами без присмотра общей системы внимания, то можно говорить о разных сущностях. Так делится эмбрионально на двойню или тройню некоторой сепарацией направленности клеток, что в итоге порождает две сущности. Так же происходят расстройства сознания, раздвоение личности, когда невозможно сознанием обеспечить единство контроля внутренних систем.

Как мы можем посчитать нашу самость, только в сопряженности (alignment) к общему направлению действия. Т.е. сущность более сложная получается путем сопряженности QRF (QRF = expected value + computation, т.е. модельные данные из памяти + новая информация ) к взаимодействию окружению. Это сопряженность может задавать внимание, как контролирующий орган.

Взаимодействие, подстройка (alignment) агентов на границе Markov Blanket исходя и из QRF может быть описано 4 ситуациями:

1 - один агент измеряет другого, у другого нет QRF для измерения и выделения объекта. Подстройки нет.

2 - у одного агента QRF уже, чем у другого. он может измерить что-то на границе про другого агента. Первый агент может что-то узнать про агента 2, но ему будет недоступно его поведение.

3- у агентов одинаковые QRF, но они не центрованы, поэтому их измерения друг друга не полны. Каждый агент теряет часть информации, что делает другой.

4 - у агентов совпадает ширина QRF и они центрированы. агенты могут измерить друг друга. Оптимальная ситуация. Каждый может видеть, что делает другой на границе своей системы в определенном секторе.

Оптимально, когда ситуация 4, тогда мы можем минимизировать потери в предсказании. Наши ожидания действия не будут отличатся от измеряемых действий. Сплетенность entanglement — это не копирования, а симбиоз, когда фактически мы можем действовать как один организм. Это минимизация Variational free energy (VFE). Таким образом, следования принципу минимальной энергии ведет к сплетению между разными агентами для минимизации вариативности предсказания. Идеальная модель совпадает с моделируемым объектом. Если QRF двух систем совпадают, то системы неразличимы, а запутанны. Они являются одной системой и не могут копировать информацию другой.

Free energy principle. Наши действия меняются, но не под воздействием внешней среды, они уменьшают энтропию внутренних состояний, упорядочивают взаимодействие нодов внутри Markov blanket. Эти действия будут направлены на поддержания структурной и функциональной целостности системы внутри Markov blanket.

Обучение. Обучение и выживание сильно связаны, т.к. обучение дает возможность извлекать информацию из окружения для ее предсказания для выживания. Минимизируем ошибку предсказания. А стабильность окружения нужно для возможности обучения. Запоминаемая информация должна быть значимой и объяснительной. То, что не попадает в значимые и объяснительные мы не сможем включить в границы своего Markov blanket для возможности воздействия и предсказания поведения.

Метаболический выбор. Получаемую из окружения энергию можно тратить на (trade-off):
a- накопление информации,
b- получение информации,
c- действие.

В менеджменте это выстраивают в цепочки последовательностей (типа OODA, PDСA), но, по сути, в каждый момент это trade-off (уже действовать или еще понаблюдать) и вариации последовательностей не строго заданы.

Чтобы потреблять больше информации из окружения и действовать, затратно тратить слишком много энергии на память. Тогда я запоминаю не точно, а крупнозернисто (размыто), чтобы не расходовать много энергии. Живые организмы делают такое упрощение, размытие, для уменьшения нагрузки на память (не точное копирование событий в память, модельное).

В памяти записываются общие свойства систем. Чем более общее свойство/правило/функцию/поведение мы сможем выделить, тем экономнее мы сможем ее сохранять. Эти знания как об окружении, так и о себе (эпистемология), принципиально всегда будут неточны и не полны.

То есть модели, которые заносим в память должны обеспечивать устойчивость в быстро меняющемся окружении, для сохранения устойчивости системы на границе с окружением.

Пространство возникает при регистрации изменения окружения. Но если у агента есть память, то он может зафиксировать это изменение в окружении. Агент может зафиксировать эту связь между событиями в разных частях окружения. Фиксация этого изменения в окружении и есть понимания хода часов, некоторой периодичности. Как только у агента появляется память и способность фиксировать изменения, то у него появляется значение времени в его периодичности. Агент может наблюдать окружение, действующее в качестве часов. Безвременье — это окружение, в котором ничего не происходит.

Для возникновения часов минимально необходимо:

разделяемые и с отсутствием обмена сектора в окружении,
периодического возникновение событий в секторах окружения
память.

Что не является необходимым:

определение объекта или движения
пространство, заданное какой-либо системой координат.

То есть время в QRF возникает как более фундаментальный аспект, связанный с наличием памяти у агента.

Как в пещере, в абсолютной темноте мы можем считать капли для описания времени, но ничего не сможем сказать о пространстве.

В филогенезе организмы гораздо дольше фиксируют время в окружении, чем пространство.

Для возникновения пространства требуется фиксация одного и того же объекта в движении. Должно быть понимание объекта и идентификация его как того же самого на другом месте (смена сегментов размещения в окружении), при этом идентичность объекта при движении не меняется. Это постоянство объекта классическое, не квантовое. Постоянство объекта наблюдения и есть как раз переход от квантовой идеи (запутанность состояний) к классической.

Постоянство объектов мы постигаем действием с объектами. Таким образом формируется пространство в QRF.

Т.е. для формирования пространства в QRF нужно получать одинаковые сигналы сенсорные в разных сегментах окружения, а для формирования времени только память и возможность фиксировать в ней изменения.

Для создания системы координат нужна только фиксированная точка в окружении, которая не будет меняться во времени. Можно говорить об этом как о движении, вращении, так и о размерности (больше-меньше). Так же при наличии такой точки можно говорить и собственном движении в отношении данной системы координат.

Для пространства нужна некоторая линейка для измерения. Линейка с ее системой координат и является пространственной QRF.

Память создает цикл возникновения пространства времени. Наличие памяти дает возможность фиксировать постоянство объектов, что дает возможность корректировать ошибку памятью внешней системы (постоянство объекта в окружении и во внутренней памяти), что дает возможность возникновению концепта пространства-времени, что приводит к использованию пространства-времени как памяти (экзопамяти).

Error correction позволяет идентифицировать объект как одинаковые во времени и пространстве, поэтому дает возможность реализоваться самим понятиям времени и пространства.

Иерархическая сложность. Поскольку агенты взаимодействуют только на границе меньшей размерности чем их собственная размерность, то для предсказания поведения других QRF других объектов требуется выделения отдельных границ с разными QRF, т.е. усложнения внутренней структуры системы. Сложность ведет к разделению. Мы имеем сложную систему, которая потребляет много энергии из окружения для обеспечения вычисления по раздельным QRF на своих границах, что ведет к выбросу отработанного тепла в окружение, что повышает энтропию окружения, что ведет к усложнению предсказания дальнейшего поведения окружения и усложнению системы. Круг замкнулся. Работая сложно для предсказания поведения окружения, мы выделяем много тепла в это окружение, повышая энтропию системы и усложняя вычисления для улучшения предсказания.

Каждая система действует таким образом на своем уровне отдельно. Накапливает информацию и реплицируется. Иерархия сложности образуется в результате усложнения модельной информации, которая накапливается в памяти системы.

На разных уровнях работают свои оптимумы, но возможность перемещается по уровням как вниз, так и что более важно вверх — это попытка понять, что оптимально на уровне выше, чем мой для снижения неустроенности системы в целом.

Усложнение систем контроля эволюционно возрастает с увеличением сложности системы (внутренних границ системы, кол-ва компонентов, компонетизации).

Универсальный дарвинизм говорит об очень простых вещах. Что система копирует себя и добавляет разнообразия. Кто крутит этот цикл наиболее эффективно, тот выигрывает. Это естественный отбор по Дарвину.

Разнообразие также многоуровневое. на уровне генов, на уровне клетки, на уровне организма (обучение, адаптивность), на уровне сообществ (культурные конструкции). Разнообразие активно и происходит на разных уровнях.

Что же при этом с рабочим проектом?

Моделирование ограничено как интересом, так и возможностью управления (предсказательность + управление).
Модель должна быть обязательно объяснительная. ADR
Модель должна иметь выход в реальность, в действия по этой модели.
Модель должна корректироваться в связи с ее использованием
Более сложная модель будет учитывать поведение включенных в нее, но определение поведения общей модели идет в обратном направлении.
Модель должна быть эволюционно устойчива к изменениям на границе в своем классе решений.
Модель должна иметь возможность встраиваться в более сложный контекст моделирования.
Модель должна позволять существенно сокращать затраты в реальном мире для оправдания своего наличия.
Модель должна иметь конфигурацию (память своих состояний).
Усложнение модели – естественное развитие, но оно должно удерживается в границах полезности.
Модель нужно обучать на разнообразных контекстах. Контексты должны быть разноуровневые.
Части модели могут как выделятся, так и схлопыватся, в зависимости от ответа на обучение.