Понятизация, онтологический дребезг и прочее про язык -- уже в FPF, спасибо Codex App

ailev · 07.Март.2026 21:16:32

Из-за AI-агентов жизнь изменилась: она у части населения (добрались новые инструменты явно не до всех – https://www.anthropic.com/research/labor-market-impacts) стала умнее, а также ускорилась. Теперь из “мозговых результатов” можно получить кучу того, что пренебрежительно называли “нейрослопом” у стареньких дешёвых моделей, но экономически доступно и крайне быстро стало получить “нейрозолото” у новеньких дорогих моделей, а ещё надо ведь уметь отличать нейрослоп от нейрозолота, в том числе и разные их гибриды. И вот дальше – мусор в постановке даст мусор в результате: чтобы получить что-то ненужное, надо сначала запросить что-то ненужное. Искусство проблематизации, постановки задачи с потенциально интересными решениями (stepping stones в open-ended evolution) выходит на передний план. Изо всех утюгов, во всех лентах одна и та же мысль: “Раньше дефицитом была способность самому произвести интеллектуальный результат. Теперь всё чаще дефицитом становится способность выбрать, какой результат вообще стоит производить, в каком представлении его лучше искать, как принять его в работу и кто отвечает за последствия”. Ссылок даже не даю, я эту мысль писал давно. А на прошлой неделе на эту тему отписался чуть ли не каждый первый программист.

В части эпистем сработала классическая постановка вопроса фильма “Сталкер” (или “Пикника на обочине”): если у вас есть Супер-пупер-мозг (и ему ещё дали tooling и интерфейсы в мир, хотя это всё и информационное, то есть это не просто мозг, но ещё что-то не очень embodied), что вы попросите? Классическое “счастье всем, даром, и пусть никто не уйдёт обиженным?” с неминуемым конфликтом в ответе (счастье волка в катастрофе для зайца, обида вора на лоха за то, что ему не дали своровать, и т.д.)? Запросы нужны всё-таки не художественные, а реалистичные.

Если у вас есть работа, то вы сдвинете на Супер-пупер-мозга свою работу. Вот я сдвигаю, программисты полным ходом сдвигают (даже самые сопротивляющиеся, горячая сейчас тема). Но эту работу ведь как-то надо ещё придумать! Зачем тут вы, если запрос – “придумай интересную работу”, а затем “поручаю тебе её выполнить”? Сразу так и пишите: “я не знаю, что тебя попросить, недельные лимиты на использование тебя у меня огромны, поэтому придумай себе что-нибудь эдакое, а потом сделай – но так, чтобы у меня появилось много денег и свободного времени”. Интересно придумал, да? Но если бы это я придумал, я бы не так просил: я бы добавил FPF и слайдомент про развитие для развитых – и попросил бы не просто придумать, а придумать что-то конкурентоспособное. Но для этого ведь надо знать магические слова про NQD, Парето-фронт и всякое такое! Это и было раньше “искусством постановки задачи”, а сейчас – “инженерия постановки задачи”. В искусстве результат не слишком воспроизводим, зависит от вдохновения, а в инженерии мы всё-таки рассчитываем на успех проекта и независимость от вдохновения: работа выполняется, выполняется хорошо, её выполняется очень много, и она каждый раз выполняется хорошо – промышленное ведь производство.

Можно, конечно, стать посредником: кто-то придумывает, что надо вам делать – вы пересказываете это Супер-пупер-мозгу, он делает, вы передаёте просившему. Но просить Супер-пупер-мозг можно и мимо вас, зачем вам платить посреднические? Просьба к Супер-пупер-мозгу стоит копейки, вы на этом простом посредничестве большого процента не возьмёте. Резко обесценивается “арбитраж”, слабое посредничество, а выживает только сильное посредничество — то, которое умеет формулировать проблемы так, что решение их будет иметь спрос (“предпринимательство”), проверять сделанную работу в силу лучшего владения контекстом. “У меня работает, отстаньте” – это же классическая отмазка исполнителя. Надо проверить, что работает у тех, у кого должно работать. В нашем случае у AI-агента-исполнителя, конечно, всё работает, но надо эту работу принять по-человечески (pun intended), надо быть ответственным (это означает страховку последствий, вот буквально финансовую) и держать проект целиком. Ведь кто-то работы по агентам раскидывает, кто-то должен их собрать и убедиться, что правильно всё было оркестровано с агентами и результаты работы склеились в работающее целое. Когда-нибудь это тоже будут делать агенты, но пока ещё они с этим не очень справляются для всех видов работ.

Сильное посредничество пока слабо коммодитизируется, ибо даже Супер-пупер-мозг может просто ничего не знать о контексте, в котором вы оказались и каким владеете – и всё, вот у вас и преимущество. Или у вас есть лишние деньги на лишнее мышление и действие в порядке проверки гипотез, и вы их потратили на правильный stepping stone, а кто-то эти деньги спустил – вложился в утопию. Опять, на текущем ходу эволюции у вас какое-то преимущество. И дальше – кто дольше протянет, конкуренция ведь не имеет “окончательного выигрыша”. Опять же, “найти перспективную проблему” – это только начало, “поставить проблему (problem framing)” тут уже много потрудиться (это про то, как описать, чтобы агент или команда агентов сделали хорошо), а затем надо пакетировать результат в продукт, найти способы монетизации – Элон Маск говорил, что его мало волнуют стартапы с новыми отличными прототипами электромобилей, потому что это самое лёгкое. Вот построить завод, задёшево выпускающий большие объёмы этих электромобилей – вот это дорого.

Так что а) надо становиться умнее всех других посредников, хотя в рецепт успешного успеха явно входит не только умность, но всё же, а также б) самому придумывать что-то такое, что другим в голову не придёт попросить у Супер-пупер-мозга (как быстро всё поменялось, ещё вчера было “спросить”, а теперь ещё и “попросить” стало возможно), но результаты были бы интересны (то есть надо ещё и иметь вкус к этой “интересности”, а для этого – “насмотренность”). И торговать результатами вопросов (хотя повторить эти результаты – задать тот же вопрос). Очень интересный мир. В любом случае, в нём лучше бы быть умнее, чтобы хоть как-то ориентироваться в происходящем. Поэтому мы в МИМ продолжим возиться с людьми. В частности, я:

продолжу писать FPF, чтобы усилить и так уже вполне сильный AI.
продолжу разрабатывать руководства, чтобы сделать умнее и так уже вполне умных людей.

Это всё относится и ко мне. Все побежали в сторону LLM, и я побежал (хотя долго ждал, просто отслеживал). Пару дней назад вышли GPT-5.4 и Codex App для Windows – я этого тоже долго ждал. Сразу поставил себе Codex App с GPT-5.4 и начал работать с ним. Там GPT-5.4 xhigh – самая продвинутая из доступных моделей, но вот GPT 5.4 Pro недоступна, увы, так что одновременно продолжил с GPT-5.4 Pro на web-UI. Ах, на сегодняшнее утро у меня готова версия с language-governance core из десятка новых и переделанных паттернов. Вау! На реализацию уже более-менее поставленной задачи – пара дней, вместо почти пары недель, на которые я рассчитывал.

Release early, release often. Я опубликовал новую версию: GitHub - ailev/FPF: First Principle Framework · GitHub. Пробуйте.

Конечно, это всё не точка, а запятая: дальше я буду эту “работу с языком” пополнять и дополнять. Если бы речь шла об инструментальной ситуации недельной давности, я бы прыгал от радости, писал бы отдельный пост на эту тему. Но не сейчас: если у меня каждый день заканчивается такая большая работа, то в чём праздник? Выход одной небольшой версии?

Ещё неделю назад я бы не назвал эту версию “небольшой”: там ведь реально архитектурные прорывы! Огромный сложный пункт моего плана от 1 февраля у меня реализован с существенным превышением не только по скорости, но и по содержанию. Так, удалось втащить понятизацию – включая focusing с TAE и “онтологический дребезг” со многими ещё и расширениями, ещё и Пирсига с dynamic quality сюда же – там целый bundle на эту тему “доконцептуальной мысли” появился. Удивительно, но можно думать о реализации ещё до апрельских конференций и семинаров вообще всего плана от 1 февраля Начинаем февраль 2026: громадьё планов по FPF: ailev — ЖЖ – там точность языка (вот она уже как-то “решена”), далее целостность/холоны точным языком, далее графы трансдукций, далее commits/MOVE и попробовать TGA с evolvability для thinking, далее проблематизация и конфликты системных уровней, далее архитектура, затем собственно первопринципность и далее можно идти на SoTA-packs инженерии и менеджмента.

Сейчас публикация каждого пункта этого огромного плана – проходной рабочий момент. Единицей выполнения плана является уже не его пункт, а он весь.

Ну, и сейчас я бы даже вот этот пункт не стал считать законченным. Раз уж можно давать поручения Супер-пупер-мозгу, то надо этим пользоваться: у меня появилось много новых вопросов к реализованному. Раз уж всё так быстро, я ещё почищу этот новый кусок. У меня тут сработало наличие хороших заделов – прежде всего, я сам, любимый, как “задел”. Мастерство владения семиотически-репрезентационной темой оказалось уже прошито в мокрой моей нейросетке, а кроме LLM (и даже world model) в этой мокрой нейронной сетке была ещё и работающая архитектура NI-агента (NI, natural intelligence, небось уже забыли об этом сокращении), ибо в моём составе есть и внешняя память и выход tooling, и интерфейсы к другим агентам, из них главными оказались интерфейсы к Codex App и ChatGPT на web-UI (вот тут я прописывал разницу между LLM и AI-агентом на базе LLM, и даже application на базе AI-агента, который на базе LLM: Рок-н-ролл сдвигается с AI-агентов на универсальные приложения (на примере Codex).: ailev — ЖЖ).

Я понимаю, что эта новая часть FPF вряд ли бы случилась без моей постановки задачи и проверок качества исполнения. AI-агенту надо говорить, над какими вопросами думать и проверять то, что он там надумал. Сам он себе работу поручить может, но обычно поручает что полегче и попроще (зато “на слуху”), а не что поинтересней.

Какие вопросы я сегодня задаю этому Супер-пупер-мозгу? Вот прямо сейчас GPT-5.4 Pro у меня думает (это занимает обычно от четверти часа до сорока пяти минут на один вопрос – независимо от номера Pro модели, только ответы становятся с каждой новой версией старшей модели чуть умнее) уже третий раз (я ведь спрашиваю обычно раза три подряд). Копирую промпт целиком: “Тут мы всё время говорим о “языке” и language-governance core или чём-то подобном. Но есть много других слов, которые легко представить на этом месте: semantic-governance core, speech-governance core, viewpoint-governance core (ибо viewpoint как раз включает обычно и representation, notation и поэтому “включает язык”). Это теснейшим образом ещё связано с эпистемологией (ибо речь идёт о движении мысли и языковом оформлении этого движения), с онтологией (ибо язык у нас прежде всего описывает понятия) и с concept theory (theory theory, prototype theory и т.д.), а ещё легко представить это как lexical-governance core (ибо речь про лексику прежде всего), linguistic-governance core (лингвистика традиционно изучает языки) и т.д. (какие ещё есть варианты, которые я пропустил?). Надо ли сделать в FPF какой-то паттерн, вводящий более точную терминологию, RPR для всех этих понятий-триггеров? Что из этого всего наиболее подходит для названия того, что у тебя language-governance core? Какие ещё core надо было бы добавить, чтобы закрыть все эти предметные области? Это всё первопринципные области, или какие-то из них “прикладные, второстепенные”? Как в FPF архитектурно устроены сейчас все эти “управления” семантикой, лингвистикой, языком, эпистемологией, онтологией, лексикой, концептуализацией/понятизацией и как надо было бы их сделать?” – и вот примерно такое я пишу последние несколько дней.

Подобных вопросов я поназадавал ещё много, над ответами пока думаю – вот ровно “читал пейджер, много думал”. Пока думаю про упорядочивание уже наработанного, чтобы стали понятными дыры. Скажем, сейчас используем “язык”, но если уйти от чисто “языка” – как организовать FPF в части всего этого языко-ориентированного? Я тут вспоминаю посты про “йа язычнег, дайте мне капище”, Йа -- язычнег, дайте мне капище.: ailev — ЖЖ – про языкоориентированное программирование, ещё в 2009 году: “Каждый человек – язычнег, нет в современном мире постмодерна места моноязыкизму. Идея Единого Языка, конечно, интеллектуально привлекательна, но неконструктивна: результаты такие же, как с монотеизмом – вон сколько их на планете, разных монотеизмов, один другого краше и истиннее”. Там обсуждались language workbenches, и языки программирования. Это сейчас выясняется, что языки не так уж важны – но тоже не всегда “не важны”, ибо есть представления “непосредственно исполняемых нотаций” у Danielle Macbeth (SeeingHowItGoes_Danielle_Macbeth.pdf — Яндекс Диск), символьные формализмы в логике у Catarina Dutilh Novaes (Formal Languages in Logic A Philosophical and Cognitive Analysis (Dr Catarina Dutilh Novaes)2012 (Z-Library).pdf — Яндекс Диск), и тут попытки разобраться, что там за аналог “нотаций” внутри LLM (скажем, для арифметики – геометрические “странные формы”, тут важные работы вроде [2602.15029] Symmetry in language statistics shapes the geometry of model representations, [2602.22617] Semantic Tube Prediction: Beating LLM Data Efficiency with JEPA, [2601.04480] When Models Manipulate Manifolds: The Geometry of a Counting Task (представление арифметики для манипулирования, представления в плане их affordance).

Конечно, “язык” у меня понимается шире обычной лингвистики: как выбор представлений, степени формальности, семантической точности и способов перехода между представлениями (трансдукциями, есть же уже в FPF архитектура графа потока трансдукций). Супер-пупер-мозг говорит, что надо подниматься выше и говорить о semiotic and representation-governance, а “язык” оставлять как некоторую презентационную сторону для человеков (и в мае 2025 я уже упирался в то, что там объемлющее: семиотика ли часть лингвистики или наоборот, и что там с языками и знаками – вот через месяц надо не забыть вернуться к этому вопросу, это вот тут было: Telegram: View @typeslife).

Так что интересуемся и тем, что происходит после отмирания традиционной token-centered (в локальных представлениях) лингвистики – работами вроде Byte Latent Transformer с патчами вместо токенов из [2412.09871] Byte Latent Transformer: Patches Scale Better Than Tokens, DroidSpeak из [2411.02820] DroidSpeak: KV Cache Sharing for Cross-LLM Communication and Multi-LLM Serving, LCM с “concept – это эмбеддинг фразы” из [2412.08821] Large Concept Models: Language Modeling in a Sentence Representation Space. Надо добавить недостающую симметрию ходов в пространстве языка-семантики (не только повышение точности, но и наоборот) и поперечные transform-families: controlled semantic coarsening, representation transduction, carrier transduction, interpretive construction. Без этого RPR остаётся сильной, но односторонней веткой “формализаторов”. Тут ещё много идей, скажем, A.6.3 specialisations для conservative re-textualization: перевод, summary, filtering, report (очень многие из операций информатики в моём посте 2012 года, Информатика: ailev — ЖЖ — это именно views over the same described entity). Работает мой zettelkasten, пригождаются старые посты! Поэтому всё и быстро: я знаю, чем кормить AI-агентов.

Или ещё можно делать pattern for explanation (justification surfaces): когда текст генерируется из какого-то следа/трассы, вывода вроде CoT или модели, но нужен explicit provenance, чтобы не путать faithful rendering с post-hoc narrative. Это пока скорее архитектурный пробел, и тут я опять должен буду вернуться к старым наработкам по рендерингу. Рендеринг/порождение/деформализация/элокуция/“разворачивание схемы”/нарративизация как операция, обратная мета-моделированию. Много занимались этим где-то в 2019 году – вот и пригождается, Обсуждение по схематизации и рендерингу: ailev — ЖЖ). Третье — явная развязка между interpretation as conservative reading и interpretation as hypothesis generation. Сейчас это частично можно собрать из A.6.3 и B.5.2.0, но отдельный pattern сделал бы эту “интерпретацию” намного яснее. A.6.P-style bundles — это substrate-facing semantic front-ends, их тоже надо наработать некоторое количество. И, конечно, Dynamics & Transduction Architecture — это более широкий meta-layer, который объясняет, как вообще в FPF устроены изменения состояний, преобразования артефактов и их enactment. Такого у меня много-много страниц утром и написалось, и нагенерировалось, так что я пока этим подавился и буду разгребать всё высвобожденное неожиданно (или ожиданно!?) время.

Ещё определились темы моих семинаров, оба они на тему отличий продуктивного разнообразия в генерации вариантов от беспорядочного метания:

Бесплатный вебинар 22 марта 2026 (хотя у меня есть идея таки вытащиться в офис) “Три прототипа — это нормально. Три исправления ошибки — нет”. В инженерии несколько вариантов решений, из которых выбирается один — это нормальный поиск (trade-off studies), а многократные исправления (переделки/rework) — признак плохой инженерной дисциплины, пустая трата времени. Как их различить? Какие причины заставляют делать много вариантов — и это не впустую, а какие причины заставляют переделывать по многу раз — и это как раз впустую?
Семинар 12 апреля 2026 как раз про надзор (governance) за точностью языка:
— у инженеров обычно императив “надо писать точнее”. Текущий мой заход на а) есть множество характеристик языка вроде формальности, распределённости представления, возможности проверить и т.д., схлопывать в один скаляр “точности” не будем. Надо как-то научиться говорить о языке более богато, чем только “точный — не точный”. б) надо управлять языковой динамикой, движением выражения на языке в пространстве этих характеристик. То есть иногда “надо писать/говорить точнее и формальнее, разжимать” (чтобы проще было коммуницировать и проверять), а иногда “менее точно, менее формально, сжимать” — чтобы проще было делать догадки и проводить аналогии. Управлять, двигаться во все стороны по всем характеристикам языка.
— с AI нам надо уметь управлять характеристиками языка и как минимум понимать устройство общения с ними.
— AI-агенты смогут делать всё. Но надо будет уметь описать задачу, удержать в мышлении проект в целом, разобраться с последствиями того, как AI-команда реализовала задачу. AI-команды будут реализовывать задачу крупными кусками, каждый из AI-агентов будет работать за группу специалистов-людей вчерашнего дня, причём быстро. Поэтому специалистам-людям завтрашнего дня (ну, или уже сегодняшнего) надо будет иметь то мышление, которое сейчас имеют их начальники — чтобы удерживать проект в целом. Это в том числе означает, что надо будет уметь осознанно управлять характеристиками языка, на котором происходит мышление, и осознанно выбирать язык (формальный математический или неформальный естественный, с картинками или без, образный с аналогиями или канцелярит, термины из какой инженерной или научной традиции, и т.д.) для каждой конкретной ситуации. Работе с широко понимаемым “языком” и его семантикой как объектами первого класса, характеризуемыми многими признаками, надо учиться – хотя этому массово никто не учит явно (но мы – учим).
— в работе с языком есть много того, что остаётся сегодня мало осознанным. Например, работа с “доязыковыми представлениями” при концептуализации (динамическое качество Пирсига, felt sense в focusing и TAE, латентные представления в глубоком обучении и т.д.). То есть учиться надо не только тому, что и так известно, но многое в работе с языком вам неизвестно, поэтому вы не сможете сами составить себе программу образования.
— изучение иностранных языков до приличного разговорного уровня занимает от 600 часов до 2200 часов в зависимости от того, насколько близки по структуре эти языки к родному. Цифры давно известны, вот пример оценок FSI (Foreign Service Institute правительства США, для англоязычных учащихся – Foreign Language Training - United States Department of State). Так что нельзя ожидать, что “я тут пройду пару семинаров по языкам в их расширенном понимании и смогу потом их менять как перчатки”. Нет, за пару семинаров вы узнаете о существовании многочисленных проблем, а затем вам придётся решать эти проблемы довольно долго, в том числе в резидентурах программы рабочего развития. Долго, ибо у людей медленно вырастают синапсы и улучшается капиллярная структура в тех областях мозга, которые ответственны за то или иное мышление. А ещё это всё будет сразу, прямо в марте 2026 поддержано FPF, и Супер-пупер-мозг будет решать эти проблемы без вас. Время надо, чтобы вы могли потом с этим Супер-пупер-мозгом на эти темы поговорить, а не смотреть на его выдачу как мартышка на очки в басне Крылова.