Lytdybr от 16 мая 2025

ailev · 16.Май.2025 12:21:44

Потихоньку переписываю руководство по системному мышлению для инженеров-менеджеров. В обязательствах добавилось кроме подробностей про квалификации и про последовательность освоения мышления и работы по руководствам программы рабочего развития прописать ещё и понимание инженеров-менеджеров, там обнаружилось много нюансов, требующих разъяснения. Учитывая то, что очень многие пользуются руководствами ещё и как справочниками (игнорируя при этом повторения, ибо это “примеры использования концептов в разных контекстах”), переделываю везде по тексту и студентов, и стажёров в инженеров-менеджеров. Ещё из интересных моментов – это выбор из “интеллект-стека фундаментальных методов мышления” и “фундаментальных методов мышления интеллект-стека”. Я поговорил на эту тему со знатоками русского языка (Gemini 2.5 pro свежей версии и ChatGPT o3), они говорят, что можно и так, и так, но акценты разные: в первом случае это целый объект стек вместе со всеми методами, а во втором – россыпь методов из этого стека. И вот обращение к этой россыпи методов в русском языке неклассическое и плохо сокращается, а вот интеллект-стек – это хорошее сокращение для первого, а ещё полностью соответствует конструкции “предмет стек чего в стеке”, принятой в инженерной среде (все эти tech-stack, data-stack и т.д.). Формально вводится академически как “стек фундаментальных методов мышления, далее интеллект-стек”. Я тут сравнивал с “магазин патронов” и “патроны магазина” (магазин ведь – это стек, только по-русски, я застал обучение программированию, когда вместо стека говорили “магазин”, первые программы ведь я писал в 1975 году, см. комменты в Когда в СССР магазин поменяли на стек? - Юрий Панчул — LiveJournal).

Неожиданная дискуссия про подробность моделирования во взгляде из системы наружу: моя система маленькая, мой проект маленький, а вот по пути к целевой системе и за её пределами огромный мир, который невозможно отмоделировать, даже если представлять его весь как системы. Лекарство (системный подход), становится болезнью: вместо отбора самого важного и поэтому упрощения, системное мышление позволяет найти ещё много чего “влияющего” – а поскольку всё влияет на всё (только в разной степени! но это надо разбираться с причинами-следствиями), то можно легко выскочить за ресурсные ограничения на мышление-моделирование. Разговор вот отсюда: Telegram: View @systemsthinking_course. Мои усилия в руководстве были на то, чтобы вытащить из копания в своём проекте во взгляд наружу, это крайне трудно тренируется. Но вот что после того, как взгляд вытащен наружу он пойдёт моделировать всю Вселенную и может не догадаться, что надо бы где-то остановиться – это для меня неожиданность. Надо вставить в тексты на этот счёт какие-то пояснения (хотя я там писал про “лекарство стало болезнью”, но надо повторить несколько раз в разных контекстах). И, конечно, пояснения про мантры/сюжеты/нарративы – там много материала, но это важно. Тема мантр, наконец, замечена – и пошли позитивные отклики от ознакомившихся.

Сразу два захода на “квантовую гравитацию”, т.е. квантовые подходы к теории относительности:
– constructor theory of time от Deutsch и Marletto – [2505.08692] Constructor theory of time
– neural relativity, от Ванчурина – https://www.researchgate.net/publication/391773622_Neural_Relativity (и тут ещё и интрига про отказ публикации в Arxiv, типа как “сначала опубликуйтесь, потом разместим”, то есть Arxiv выступил как “пост-препринт” – разве такое бывает?! Вот такие неожиданности: подробности в Telegram: View @theworldasaneuralnetworkchat).

Интереснейшие рассуждения от Andrej Karpathy, которые во многом повторяют мои рассуждения про эквивалентность обучения LLM и мокрых нейросеток в людях: https://x.com/karpathy/status/1921368644069765486. Он высказывает мысль, что обучение предметной области у LLM – это должно быть не обучение весов, а создание некоторого системного промпта, System Prompt learning, which resembles RL in the setup, with the exception of the learning algorithm (edits vs gradient descent). it would look a bit like the LLM writing a book for itself on how to solve problems. Ему отвечает тут же Tim Rocktäschel из тусовки open-endedness: “Пожалуйста, вот: [2309.16797] Promptbreeder: Self-Referential Self-Improvement Via Prompt Evolution”, Promptbreeder: Self-Referential Self-Improvement Via Prompt Evolution", https://x.com/_rockt/status/1922283109413724438. Karpathy в ответ говорит ровно то, о чём толкую довольно долго: “результаты изучения предметной области людьми должны на выходе давать руководство”, “training” an LLM on a target domain should output a manual not a weight diff. Тут много разных нюансов (скажем, manual это “инструкция” обычно, а не “руководство”, а я говорил раньше “учебный курс”, а сейчас склоняюсь к “руководству”). Ну, и если это реально хороший промпт, то почему бы не занести его в weight diff. Но wait… это ж как раз какой-то ход на управление конфигурацией знаний: много проще менять промпты, чем накатывать и откатывать назад weight diff.

В принципе, метафора классического компьютинга “написать программу, откомпилировать её, исполнить” уже померла, хотя классических программистов – масса. Но вот prompt engineering в какой-то мере жив: с одной стороны, “пиши что хочешь, не заморачивайся промптом, LLM сама себе сваяет промпт”, а с другой – “результатом коммуникации является её результат, а не то, что ты думаешь”. Если ты говоришь невнятно даже на уровне лексики (скажем, “возьмём как пример выпечку” – тут процесс выпечки берут как пример, или выпечкой называют то, что лежит на противне? Это не придуманный пример, он всплыл на наших четверговых разборах по первому шагу системного мышления), то тебя не поймут-с даже кремниевые мозги, а не только люди. Тут же мы говорим о “системном промпте”, где требования к точности ещё выше, поэтому prompt engineering и риторика оказываются очень близкими, а в риторике ещё и главный вопрос: в чём хотим убедить, содержание речи. И вот варианты использования замечания Karpathy (ибо я могу ссылаться на себя, но нет пророка в своём отечестве – ссылка на то, что “это не я придумал, это знаменитости” в риторике работает надёжней, чем “слушайте, я вот тут подметил”):
– поменять везде, где говорим о “прошивке мозгов как обновлении софта на телефоне” и прочем таком на “новую модель LLM в вашем мозгу с новой датой cut off”. С софтом вроде более менее разобрались все, но вот миллиард пользователей AI-агентов уже вроде тоже созрел, неожиданно быстро.
– говорить, что “вы, конечно, очень умный, но как правильный системный промпт из LLM вытаскивает или не вытаскивает весь тамошний ум, так и вам нужен правильный системный промпт: и он в наших регулярно обновляемых руководствах”. Тут некоторое лукавство, конечно, ибо заменить промпт объёмом в два романа “Война и мир” в нейросетке легко, а вот в нейросетке человека – трудно, это всё-таки “weight diff”. Хинтон как раз про это говорил: “у искусственных нейросетей есть преимущество перед людьми в том, что они могут легко обмениваться знаниями, а люди – трудно”. В какой-то мере это сюжет IBM Watson 2011 года, который работал с полным текстом википедии и базы киносценариев без их сжатия, потому как непонятно, что там отожмётся – может быть как раз то, что надо знать в ответ на неожиданный вопрос! И поэтому там суперкомпьютер. Даже если учесть переход на нейросети, рассуждение остаётся верным: человек всё-таки архитектурно и не “классический компьютер”, и не “нейросетевой компьютер”, у него совсем другие архитектурные характеристики. Поэтому это всё-таки метафора, хотя и более продуктивная и точная (у нас наши руководства “намазываются” на то, что мозги человека и так знают, они именно guide/путеводитель беспокойному мозгу в его мыслительных путешествиях).
– считать, что наши руководства – это таки weight diff, но у нас есть мантры/сюжеты/канвы для направления/guide в размышлениях. Вот их и считать system prompts. На семинаре по мантрам/сюжетам/промптам я как раз и говорил, что даже их понять нельзя, если не освоить (в терминах LLM – learn, а для учительской стороны – train) все руководства программы рабочего развития, а для обсуждения и понимания ещё и программы исследовательского развития. Тут же мы имеем просто system prompts, которые отсылают к уже освоенным/learned знаниям. Конечно, system prompts тем и интересны, что работают по факту каждый раз, а не “когда обратились”.
– ещё одно использование: понять, где такое обсуждать, тут ведь тоже варианты. 1. Конечно, это инженерия личности: именно там обсуждается, как вообще учить. Рассказать в этом руководстве. 2. Но я такой мета-нарратив иногда (поскольку много вопросов по форме руководств, рекомендуемым методам освоения работы по руководствам и вопросов по тому как использовать в жизни освоенное – “руководство по пользованию руководством”) прямо вставляю в тексты руководств поближе к их началу, очень много такого в первой трети системной инженерии. По форме там, конечно – “инженерия личности”, но это слишком поздно, ибо про этот “системный промпт” надо бы знать прямо в момент начала освоения работы по руководствам. И ещё в целом по содержанию рассказа – это про интеллект, так что это надо двигать в первом разделе руководства по интеллект-стеку. Если конкретно брать мантры, то это при разъяснении этих мантр (ещё одно разъяснение, синоним “системный промпт”). Тогда надо это замечание, например, надо бы перепостить в чаты поддержки программы рабочего развития, а также исследовательского развития. 4. И даже постить в чат поддержки личного развития (недаром они там самоназвались как “сообщество инженеров личности”), ибо там сейчас активно обсуждается метафора обучения как классического компьютинга (Software 1.0), а этот ход на Software 3.0 внесёт свежую струю в обсуждения. 3. Это какой-то мета-нарратив по отношению к руководствам, “методический проект” для мастерской инженеров-менеджеров. Сейчас я такое обсуждаю главным образом у себя в блоге, это же “Лабораторный журнал”. Так что считать, что опубликовал тут – и успокоиться на этом. Или завести для такого отдельный чат “публичного методсовета”, и обсуждать всё подобное там. Но чатов и так уже много!

Как ChatGPT 4.1-mini (новая моделька, её можно найти только в more models, просто в выборе моделей её не видно) иллюстрирует предыдущий абзац. Визуальное мышление, ага: