Принятие решений с причинными моделями усредненных переменных

Abstract. “Stock and flow diagrams” are widely used for modeling in epidemiology. Modelers often regard these diagrams as an informal step toward a mathematically rigorous formulation of a model in terms of ordinary differential equations. However, these diagrams have a precise syntax, which can be explicated using category theory. Although commercial tools already exist for drawing these diagrams and solving the differential equations they describe, my collaborators and I have created new software that overcomes some limitations of existing tools. Basing this software on categories has many advantages, but I will explain three: functorial semantics, model composition, and model stratification. This is joint work with Xiaoyan Li, Sophie Libkind, Nathaniel Osgood, Evan Patterson and Eric Redekopp.

Проблема только в том, что я сомневаюсь, что такие большие композиционные модели хорошо работают. Хороший аргумент против таких громоздких моделей есть в книге “Radical uncertrainty”. Многие значения параметров в них (силы перетоков) неизвестны и берутся из головы.

John Baez сам говорит, что одно из основных применений таких моделей - это community practice/learning, то есть, привлечение разных ролей посмотреть на модель и добавить в нее недостающие связи, а также узнать про связи, добавленные другими людьми, про которые агент-в-роли не знал раньше. Но ведь если это основное применение, то и композировать упрощенные модели не обязательно?

Мне кажется интереснее подход от https://evolution.ml, который называется Evolutionary Surrogate-assisted Prescription (ESP). Насколько я понимаю, там под капотом более простые модели, и потом фактически брут-форс (эволюционный) ищет хорошие комбинации. Это больше похоже на реальную помощь для размышлений и принятия решения людьми, когда они узнают и запоминают про связи между переменными в community learning практике.

В свою очередь, даже их подход опирается на большие данные (и еще с приличным запасом интервенций, чтобы можно было отделять корреляцию от каузации в этих данных, что в примере выше было достигнуто за счет того, что разные страны по факту пробовали разные ограничения и политики во время ковида).

Поэтому, мне кажется, был бы полезен инструмент, еще более демократизующий подобное мышление о причинах и следствиях.

  • Из рассказа или существующих текстов, LLM достает какие-то причинные модели
  • Пользователь может ими управлять: менять значения любых переменных, добавлять или удалять связи, а симуляции или какие-то алгоритмы (или LLM) подствечивают странности или несостыковки в получающихся сетапах. Или модели проверяются на данных, если таковые имеются, по методам Pearl.
  • Можно попросить LLM отвечать на вопросы или решать проблемы с этими графами, а-ля GitHub - RManLuo/Awesome-LLM-KG: Awesome papers about unifying LLMs and KGs, GitHub - zjukg/KG-LLM-Papers: [Paper List] Papers integrating knowledge graphs (KGs) and large language models (LLMs)
  • Шеринг частей моделей/онтик и их соединение с помощью LLM

Применение: стратегические и архитектурные решения на всех уровнях систем, от человека (принятие стратегического карьерного решения, инженерия себя как личности) до организаций (конечно) и хоть целых стран: социальной, экономической, энергетической, и т. д. политики государства.

Проприетарных и интерпрайзных решений уже народилось много: https://causalens.com/, https://rainbird.ai/, https://quantellia.com/, https://parabole.ai/, и т. д, но, насколько я вижу, в опен-сорсе пока нет ничего (кроме кода статей про KG-LLM, но я не вижу, чтобы кто-то из них пошел в создание продукта). Нелогично!