Нормативная инженерия умных приложений и агентов

leventov · 02.Октябрь.2024 09:35:26

Вот довольно фундаментальный, хоть и короткий текст на тему: The Shift from Models to Compound AI Systems – The Berkeley Artificial Intelligence Research Blog. В нем указываются следующие свойства умных приложений и агентов:

Стандартные свойства “производительности” для ML и поиска (accuracy, etc.), а также множество производных высокоуровневых свойств, специфичных для функций/роли приложения, от relevance до disturbance robustness.
Скалируемость в смысле “scaling laws” первого рода (training time) и второго рода (inference time)
“Динамичность”: как быстро приложение подстраивается к новой реальности/данным. На спектре от лет (a la “LLM knowledge cutoff: 2023”) до микросекунд.
Управляемость и “гарантии результатов” (controllability and trust): модельные обоснования ([2408.05284] Can a Bayesian Oracle Prevent Harm from an Agent?), логические доказательства
Latency and cost - потребление ресурсов

Кроме того, ниже они дают еще несколько операционных и архитектурных свойств:

Auditability (loggability)/traceability/debuggability
DataOps характеристики для данных, которые нужны приложению или агенту во время тренировки или инференса. В терминах “-остей” это можно сформулировать как доступность, обновляемость (= доступность новых), проверяемость/валидируемость, релевантность данных
Security

Это все хорошо соотносится с этим списком:

Алгоритмика-2024

Во всем тексте, вы явно проговариваете только три универсальных свойства алгоритмов/программ: точность, скорость (задержка) и (энерго)эффективность. Хотя Скорость много где опускается. Универсальных - то есть таких, которые могут быть применены к любым алгоритмам, от самого низкого уровня в многослойном пироге вычислений, (супер)компиляций, и т.д., от высокоуровневого промпта до микрокода в железе.

Мне кажется что таких свойств побольше:

Информационная эффективность (в терминах Филдса - это размер границы/экрана quantum reference frame в битах)

Робастность/устойчивость/надежность/безопасность - не обязательно то же самое, что простая вероятность выдать неточный ответ – играет роль также степень (катастрофичности) неточности, пытаются ли систему вычисляющую алгоритм/работающую по методу активно сломать/хакнуть или нет.

Модулярность/композиционность/интероперабельность/интегрируемость (не в смысле интеграл из матана, а в смысле синтезируемость с другими алгоритмами в алгоритм более высокого уровня)/“склеиваемость”

Интерпретируемость/отлаживаемость/debuggability

Поддерживаемость/maintainability/(эволюционная) развиваемость

Конфигурируемость/контролируемость/steerability/убеждаемость/persuadability

Параллезуемость/распределяемость/скалируемость - это свойство про “алгоритмику как операционный менеджмент”

Инфоэффективность = динамичность.

Хотя сама статья называет системы compound AI systems (a system composed of LLM calls and other tools), о модулярности/композиционности/интероперабельности/интегрируемости этих систем друг с другом а-ля society of minds и не только не упоминяется. Возможно, потому что рынок еще не созрел (или не созрел на февраль 2024 - время выхода статьи) для этого: еще (было) нечему “общаться”/композироваться. Так или иначе, композиционность это как раз наша “любимая” тема в Gaia agenda.