Коннективистские концепции агентов, коннективистские архитектуры агентов

ailev · 08.Май.2023 03:17:57

Сегодня провели открытый методсовет, и одной из важнейших тем там стала архитектура личности. Вот несколько заметок по итогам.

1. Архитектура -- это про модули. Говорить о каких-то частях личности нельзя, если не обсуждать архитектурный стиль, включающий организацию коммуникации этих частей между собой. Понятно, что роли -- это функциональные части, но обойти вопрос, кто там в личности играет эти роли -- нельзя, ибо общаются-то не роли, а отыгрыватели ролей, и общаются они какими-то сообщениями через какие-то интерфейсы. Стиль этого общения и кто там главный -- это вопрос архитектуры.

2. На конференции предлагалась идея о частях личности из IFS. Даже если убрать всю терапию, и считать "часть личности оргзвеном, подличностью, агентом с небольшими мыслительными ресурсами", то понятно, что они могут захватывать всю личность и управляться каким-то Self, который вроде как "вне частей" -- некий вполне общающийся механизм, рулящий другими ролями. Дальше вопрос об архитектурном стиле: роли из разговора исключаем, и что там -- микроядерная архитектура, где Self в ядре, а части личности плагины, в него в тыкающиеся, или это микросервисы с хореографией, или это отдельный микросервис-оркестратор, или это монолит, части в котором как-то им вырубаются? Птичка-феникс из Китая, которая может общаться со всеми птичками на их родных наречиях -- так это ж не про архитектурный стиль, и по этой линии "Self -- это не часть личности" в психологии давно протоптана дорожка к этим птичкам, трансперсональная психология явно намекает, что Self -- он в космосе, и разбирается с личностями оттуда, "по ту сторону person/личности", "трансличностная психология" (помню до сих пор рекламу IBM PC в переводимом на русский язык журнале Datamation: "личный компьютер хорош уж тем, что он личный!", слова "персональный" тогда и не было, 1980й год). Что там с архитектурой, какой архитектурный стиль в части модулей и способа их коммуникации?

3. Вместе с тем на занятиях СМС (много обсуждали это на текущем 26 потоке, но и на предыдущем тоже касались этих вопросов) мы имеем следующие факты про роли:
-- люди, которые тревожились о том, кто они и что они (чаще всего это были "предприниматели" по самоощущению, которым психологически вменялось "быть всем, плюс чем-то новым, иметь особый психологический склад характера -- это и есть предприниматели"), после того, как им давали нормальный набор ролей из инженерии и менеджмента, где заодно разводились роли бизнесмена и визионера, но и говорилось о самых разных других ролях в best practices в инженерии и менеджменте, вдруг успокаивались и по-быстрому разбирались с лишними деятельностями от нежелательных для них ролей. Или смирялись с тем, что что-то неинтересное делать надо, потому как понятно зачем. То есть с ролями вроде работали, личность перестраивали. Примерно то же говорилось о курсах системного саморазвития: после того, как роли отделяли от личности в целом, от квалификации, от должностей и ещё требовали культурной обусловленности ролей, с этими ролями можно было работать.
-- материала про роли агентов в учебнике хватает, чтобы не только применять его к себе, но и к другим людям, а также к нейросеткам. Лидерство после такого обсуждения базируется на риторике (искусство убеждающей речи), а ещё этим же занималось нейролингвистическое программирование, а ещё этим занимается сейчас prompt engineering. И ведущее отличие -- это отсутствие обсуждения ролей в риторике, появление частей личности в оНЛП (оригинальном НЛП, чтобы не путать с NLP как natural language processing) и чёткая ориентация prompt engineering на роли. Важно, что все студенты отлично работают без спецподготовки с prompt engineering, ибо не путают роли, должности, не забывают указать про вариант практики для роли, дать достаточный контекст. Все хором говорят, что дополнительного тренинга для prompt engineering им не нужно, всё работает. Дальше два базовых вопроса: применяют ли они эти знания для общения с сотрудниками (да!), и применяют ли они это к собственной нейронной сетке, смотря в зеркало (нет! это просто контринтуитивно, что к себе тоже надо применять риторику, оНЛП и prompt engineering).
-- дальше говорим, что для эффективной работы требуется ролевое мастерство (умение входить в роль, выходить из роли, не застревать в роли -- и даже термин "позиция" для этого в учебнике есть), роль должна быть выучена (владение практикой, если не уметь исполнять роль -- получается плохо). Для всего этого, то есть для выполнения prompt engineering уже есть достаточный набор сведений о том, как устроена работа с ролями, нет только понимания интерфейса с нейросеткой. Понятно, что это естественный язык, и понятно, что это там где-то внутри нейросетка мозга, а не "логическая машина".

4. Тем самым у нас вроде как активная работа с личностью идёт, только надо ответить на несколько мелких вопросов:
-- что там в мозгу отрабатывает роли? Нейросетка. Какая её структура? Коннективистская, то есть никаких особо "частей нейросетки" нет. Роль и домен практики как-то "возбуждают" часть нейронов, в которых отражены в чём-то близкие понятия. Что-то приходит в голову быстрее, что-то медленнее -- там вроде как архитектура LLM как "оперативная память с моделью мира и языка, "прошивка"" плюс какой-то retriever с долговременной памятью из каких-то обрывков знаний о мире. Думалка-нейросетка думает, подтягивая (retrieve) через воспоминания по ассоциациям какие-то долгосрочные знания из предметной области. И да, память -- лучше на бумажке. Ибо нейросетка плохо отрабатывает сразу. Надо запустить сетку десять раз на генерацию (роль генератора), потом попросить эту же сетку отобрать из десяти ответов ответ получше (роль критика) -- для каждой роли задействуются чуток разные места нейросетки, мастерство (в том числе мастерство думания) размазано по нейросетке в коннективистском представлении. Эти самые "части личности, играющие роли" оказываются частями нейросетки, отображающими разные регионы пространства смыслов, которое как-то отображается в сетке. Никаких "я", просто активация нейросетки.
-- а почему IFS работает? Ну, самосбывающийся прогноз: идёт prompt про части личности, дальше весь ввод-вывод идёт с этой наведённой психолухом (ой, вырвалось!) онтикой. "Части объективно существуют". Ага, скажешь нейросетке, "ты мне отвечай в формате Васи-истопника, как митьки, и что-то там про матросов" -- и вуаля, "всё работает, в мозгу и впрямь Вася-истопник, представитель митьков, и образы все туманные, но в тельняшках!". Так prompt engineering и работает. Сказали, что роли -- будут тебе роли. Сказали, что части личности, исполняющие роли -- на тебе части личности. У нас есть пример, когда на курсе собранности GPT-4 сказали играть четыре субличности, сетка отыграла. А собственный мозг чем хуже? Он тоже отыгрывает. Если поговорить полчаса промпты про части личности, то генератор внутри головы досочинит всё, что надо -- и визуализирует их, и всё что угодно. Посмотрите как устроены промпты для нейросетки неживой, а нейросетка головы чем хуже?
-- и тут вопрос, чем именно хуже. Похоже, что в голове большинства людей GPT-3.5, а GPT-4 не включается (то есть логичное мышление с theory theory не эмёрджится, ToM не 100%). Как это преодолевают у нежити? Под слоганом "размер не главное": а) сетку доучивают хорошему поведению, ибо беды сетки не от недостаточно большой сетки, а от плохих данных, и малого числа данных. б) дают достаточно времени на подумать -- ибо что не берётся одним тактом, то берётся многими тактами размышлений сетки, включая то, что сетка может нагенерировать данных для обучения самой себя, только нужно составить правильные промпты. А ещё люди застревают в ролях, "занимают позицию" -- и тут в ролях или медленное переобучение, или кнопочка "забыть контекст/обнулить диалог", а у людей -- вызов психолога, друга, или другой вариант -- prompt engineering осознания своих ролей как первая часть ролевого мастерства. Ретривер с базой данных? Гугль или даже Bing chat как современный вариант в помощь, универсальный моделер типа notion.so или coda.io, на худой конец -- просто редактор текста (вот как я пишу, работаю со своей нейросеткой, тренирую её путём написания данного текста, удерживаю внимание не проблеме, заодно сохраняя какую-то внешнюю память о том, о чём думал -- чтобы можно было завтра-послезавтра продолжить размышлять), данные хранятся на внешнем носителе.

5. Выводы:
-- всё у нас для инженерии личности есть, смотреть надо на роли, позиции и всё с этим связанное. Ходы на "конструктивы" примерно те же, что в случае мастерства. В учебниках всё есть.
-- prompt engineering тренировать в курсе риторики, давать теорию работы с нейросетками. У нас коннективистская риторика (близкая к нейролингвистическому программированию, только там было "бессознательное" во втором коде, но мы-то понимаем уже, что дело совсем не в сознании, а в том, что там всё внутри нейросетевое, и основной режим быстрого мышления, а медленная логика включается только после правильных prompts и дообучения). Особенность prompt engineering в том, что надо чётко понимать -- какая там теория концептов в языке нашей prompt engineering. Мы метафоры используем и теорию прототипов? Полагаемся на быстрое мышление и игнорируем логику, ибо всё равно получим "а чо такова?" на логические ошибки?
-- отслеживать, что там с инженерией систем AI на базе нейросеток. Проще объяснять инженерам на этом примере, чем на примерах психологии (модели типа IFS), примерах нейролингвистического программирования (с таинственным непонятно как работающим "бессознательным"). Ибо нейросетка мало понятно как работает, но зато нет никаких идей про "душу" или "части личности, которые объективно существуют" или ещё что-то такое наведённое. Понятно, что ничего там такого нет, вычислитель и только, а в памяти какая-то модель языка и модель мира, полученная на этом языке. Что важно -- что это коннективистская модель, и композиционность там явно не из "частей". Это минимальное описание, концепции систем и архитектуры систем, где внутри нейросетки -- коннективистские. Теории коннективистских систем нет, её надо бы разработать.
-- надо давать коннективистские концепции агентов (как там функциональные объекты разложены по конструктивным нейросетевым структурам -- все эти LLM с ретриверными памятями и prompt engineering для настройки на применение). Агентов -- потому как нейросетки людей, нежити, а также групп людей и нежити (включая компании в целом), то есть групповые агенты в этом плане такие же нейросетки, состоящие из других нейросеток. Архитектуры должны быть безмасштабными и неантропоморфными, а агентскими. Особенности агентов с разной аппаратурой есть, но они не должны быть определяющими.
-- понимать методы борьбы с глупостью: а) доучивать на хороших данных -- прежде всего на текстах с логикой (лучшие LLM получили из code models, потом доучивая их на художественной литературе. Наоборот -- будет хуже), б) помним, что маленькие нейросетки можно раскручивать на самообучение (генерирование обучающих датасетов) и ещё можно получать от них умные ответы, если добавлять времени на подумать (если просить написать программу с первого раза проходящую все тесты, то GPT-4 пишет её с вероятностью 76.2%, если попросить ChatGPT с GPT-3.5 -- то там с первого раза будет вероятность 26.8%. Но если попросить GPT-3.5 сгенерировать 100 программ и протестировать их все, то среди них вероятность найти проходящую все тесты -- 89.8%. Далее считаем стоимость одной генерации и время генерации на GPT-4 против ста генераций на GPT-3.5, и ещё непонятно, какая из сеток выиграет: дешёвая и быстрая глупая сетка или дорогая и медленная умная. Пример реальный, но плохо обобщаемый. Тем не менее, если понимать, что человечьи сетки аппаратно ограничены и заведомо глупы, то можно поглядеть, что делают с такой нежитью, чтобы получить результаты не хуже, чем у богатых игроков рынка нежити -- и как-то подумать, что можно было бы делать с людьми, которые тоже "нейросетки на ножках, с ручками и электростанцией в желудке").
-- дальше много чего ещё по этой линии надо додумать, но семестр курсов "Лидерство себя, коллектива, сообщества" надо строить на базе коннективистских архитектур себя, коллектива, сообщества. Лидерство строится на понимании prompt engineering: как уболтать нейросетку выполнить prompt так, чтобы некоторое время удерживать позицию, подзастрять в роли, но не терять возможность работы с ролями (помним, что Вася Пупкин, перевоплотившийся полностью в принца Гамлета, а не отыгрывающий принца Гамлета как роль -- это псих, с ним нельзя будет работать. К ролям инженеров и менеджеров, отыгрываемых Васей Пупкиным это тоже относится).

Конечно, написанное тут понятно очень небольшому числу участников обсуждения. И это мы даже не затрагивали линию обсуждений "вселенная как нейросеть", которая идёт сейчас у Ванчурина. Там ведь тоже обсуждаются люди-как-нейросети на базе неантропоцентричной безмасштабной коннективистской теории. Но в этом и цель: прообсуждать это узким кругом, а затем в виде курсов растолковать студентам. Пусть себе лидерствуют среди себя, коллектива, сообщества -- ровно на основе этой теории. Растолкуем, научим. При этом выпускники второго семестра уже много чего знают по этой линии, уже у них с лидерством более чем неплохо. Но будет ещё лучше.

Отдельно про термин: я всё время путаюсь -- коннекционизм или коннективизм. С одной стороны, про нейросети мы говорим про коннекционизм. С другой стороны, коннективизм -- это ровно то же самое, распределённые представления. И я говорил об этом ещё тогда, когда это было не модно, вот пост 2007 года, называется как раз "Коннективизм", https://ailev.livejournal.com/459940.html. Так что я понимаю, что путаница между всеми этими "сетями связей" есть, но пока мне явно не объяснят, почему нехорошо всё это путать, я исправлять заголовок поста и упоминания коннекционизма тут не буду.

На фото мы, обсуждающие эти самые коннективистские концепции агентов на сегодняшнем методсовете. Мы там ещё много чего обсудили, но об этом как-нибудь потом.

[оригинал поста в https://ailev.livejournal.com/1684911.html]