«DeLLMa → ЕУК: как заставить ассистента не “советовать”, а считать»

advat · 19.Февраль.2026 13:12:22

Короткая заметка для блога (черновик)

Perplexity.ai предложил мне статью DeLLMa: Decision Making Under Uncertainty with Large Language Models (arXiv:2402.02392v3).[drive.google]
Я уточнил вопрос практично: как эта статья может помочь мне с ЕУК — не на уровне “поговорить”, а на уровне процедуры, которую можно реализовать и считать.

Perplexity разложил подход DeLLMa как цепочку шагов: формализовать задачу P=(G,A,C)\mathcal{P}=(\mathcal{G},\mathcal{A},\mathcal{C})P=(G,A,C), перечислить латентные факторы неопределённости, оценить вероятности состояний, задать полезность и выбрать действие по максимуму ожидаемой полезности.[drive.google]
Ключевое для меня: неопределённость π(θ∣C)\pi(\theta\mid C)π(θ∣C) и предпочтения U(θ,a)U(\theta,a)U(θ,a) разделяются, а итог получается из явного вычисления, которое можно аудировать и улучшать.

Я записал результат как рабочую заметку (в формате DecisionRecord: факторы → вероятности → utility → EU → выбор) и опубликовал её в личном блоге на systemsworld.club.
Примечание: всё это делалось в режиме GPT‑5.2 Thinking.

Подробности:

A. Суть
Вы оформили фрагмент диалога как переносимый шаблон «решение под неопределённостью» в стиле DeLLMa, чтобы ЕУК мог не “угадывать”, а считать и сохранять проверяемые артефакты решения.[drive.google]

B. Карточка заметки (для сохранения)

Источник/контекст
19.02.2026 15:23 (Мск), диалог с Perplexity Pro (режим GPT‑5.2 Thinking) по статье DeLLMa: Decision Making Under Uncertainty with Large Language Models (arXiv:2402.02392v3) и её применимости к ЕУК.[drive.google]

Наблюдение (данные)
В ответе ассистента показана процедура DeLLMa: формализация задачи как P=(G,A,C)\mathcal{P}=(\mathcal{G},\mathcal{A},\mathcal{C})P=(G,A,C), перечисление латентных факторов/состояний Θ\ThetaΘ, прогноз π(θ∣C)\pi(\theta\mid C)π(θ∣C), задание полезности U(θ,a)U(\theta,a)U(θ,a) и выбор a∗=arg⁡max⁡aEπ(θ∣C)[U(θ,a)]a^*=\arg\max_a \mathbb{E}_{\pi(\theta\mid C)}[U(\theta,a)]a∗=argmaxaEπ(θ∣C)[U(θ,a)].[drive.google]
Демонстрация сделана на «наилучшей гипотетической задаче из рутины»: выбор одного из трёх сценариев рабочего блока (arXiv‑чтение / инженерия инфраструктуры / короткий публичный текст) при неопределённостях (время, энергия, дедлайн, фрикция).
Приведены два варианта: упрощённая агрегация по нескольким “мирам” и «правильный стиль» с явным перебором 16 комбинаций состояний и расчётом ожидаемой полезности суммированием по Θ\ThetaΘ.[drive.google]

Интерпретация (выводы/гипотезы)
Гипотеза: для ЕУК полезно иметь стандартный «класс решения» (шаблон факторов + процедура расчёта), чтобы каждый раз не изобретать структуру и чтобы результаты были аудируемы человеком.
Конкурирующее объяснение: вывод “лучше a3” в примере может быть артефактом выбранной вручную utility‑модели и допущения независимости факторов, а не устойчивым свойством вашей рутины.[drive.google]

Возможные устойчивые паттерны (1–3)

Паттерн “аудируемые артефакты вместо разговоров”: хранить факторы, вероятности, полезность и расчёт, а не только итоговое решение.

Паттерн “инженерная проверяемость”: предпочтение формализации, которую можно превратить в код и калибровать по данным.[drive.google]

Теги
ЕУК; DeLLMa; decision‑making under uncertainty; expected utility; latent factors; human auditability; DecisionRecord; LLM‑agents.

Уровень уверенности
Средний: структура DeLLMa и вычислительный принцип expected utility в заметке соответствуют статье, но численные параметры демонстрации пока гипотетические и не откалиброваны под ваши наблюдения.[drive.google]

Вопросы для проверки (фальсифицируемые)

Если 10–20 раз вести журнал (T/E/U/F → выбранное действие → результат через 24 часа), сохранится ли преимущество a3 после подгонки P(⋅)P(\cdot)P(⋅) и U(⋅)U(\cdot)U(⋅) по факту?[drive.google]

Ломается ли выбор при снятии допущения независимости факторов (например, через явные зависимости/условные вероятности)?

Следующие шаги (1–3)

Сохранить “DecisionRecord v0”: (G,A,C)(G,A,C)(G,A,C), список факторов Θ\ThetaΘ, маргинали/распределение π(θ∣C)\pi(\theta\mid C)π(θ∣C), функция U(θ,a)U(\theta,a)U(θ,a), EU(a)EU(a)EU(a), выбранное a∗a^*a∗, критерий успеха через 24 часа.[drive.google]

Провести минимальную калибровку: собрать 2 недели наблюдений и обновить вероятности/utility так, чтобы модель стала предсказательной (а не иллюстративной).

Liu, Ollie; Fu, Deqing; Yogatama, Dani; Neiswanger, Willie. DeLLMa: Decision Making Under Uncertainty with Large Language Models. arXiv:2402.02392v3 [cs.AI], 11 Oct 2024. URL: https://arxiv.org/pdf/2402.02392
Дата / время обращения: 19.02.2026 в 15:23 (Мск)

advat · 19.Февраль.2026 13:14:25

Чат с Perplexity — см. здесь.