Мысли про Aisystant, лето 2023

ailev · 06.Июнь.2023 14:19:12

Несколько тезисов к сегодняшней встрече по Aisystant (на этой неделе "блог ШСМ" переезжает в "клуб" -- и надо потихоньку стратегировать дальше). Основные идеи предыдущего такта рассуждений были высказаны в моём докладе месяц назад на конференции https://www.youtube.com/watch?v=u08rhUX661A&t=9005s (слайды -- https://disk.yandex.ru/i/odHYnzuaD2AaZA), а вот какие соображения набежали за месяц:

Клуб ожидается довольно большой (ориентируемся на десяток тысяч человек, то есть лично все друг друга не знают), поэтому там будет рулить какая-то рекомендательная машинка на основе нейросетей, опыт показывает, что от этого не уйти (кто такого не сделал, того уже нет на рынке. Кто сделал первыми и качественней -- захватили рынок. "Под окнами стояли демонстрации протеста против ньюсфида, но все индикаторы показывали, что число просмотров растёт" -- это как оно происходило в фейсбуке. При этом учебные материалы могут оказаться просто рекомендованными единицами контента в общем потоке. Персональные ленты должны приноситься рекомендательной машинкой, которая должна приносить проходимый учебный курс (тексты и упражнения, пока не будут пройдены), а также посты посты одногруппников для комментирования, а также подходящие по теме посты.
Как в coda.io всё "документы", так и у нас всё "модели". Coda.io развивалась из движка блогов (от поддержки публикации к поддержке интранета), а у нас чуть ли не ровно наоборот: моделер с возможностью публикации моделей.
В моделях важно, чего они модели (какой объект моделируется. Курс моделирует мастерство для какого-то domain, например). Документы в этом плане "самодостаточны", они просто "документы" (хотя как сделано в coda и notion -- тамошние "документы" ведь модели с entity-relationship теорией понятий, но подчёркивается не аспект моделирования и мета-моделирования, а документационный аспект. Мы будем подчёркивать аспект моделирования, а уж как это выразить "документально" -- надо будет выбирать между прожекторной (датацентрической) и синтетической (документоцентрической) парадигмами моделирования. При этом понятно, что в датацентрике нужны какие-то микротеории, иначе архитектурно всё быстро станет медленной помойкой.
В моделях важна формализация (всё важное против всего неважного -- код, а ещё возможны комменты, а ещё возможны дискуссии). То есть нам таки надо иметь какой-то движок типа coda.io и notion.so -- и дискуссии и заметки должны быть там привязаны к объектам модели, как в текущих моделерах, "на полях". Является ли каждый "пост" и "коммент" сам по себе моделью -- вопрос отдельный (если делать "по уму", то являются. Если "как обычно", то это привинченный сбоку механизм тредовых дискуссий).
Конечно, модели верстаются (как мечтал о вёрстке программ Alan Kay). И в моделировании мейнстримом будут всякие коллективные системы разработки кода (IDE), только вместо синтаксической работы с подцвеченным текстом будет работа ещё и с аутлайнами и табличками. А в тексте работа с типами. Вплоть до формального кода на языках программирования. И AI тем самым подключается как "парный программист", по той же схеме.
Ключевым тут будет управление версионированием. То есть модели (и коллективные модели в том числе) хранятся в чём-то типа гитхаба (который уже тоже не "инновационен", а довольно стар по принятым там решениям) или даже "блокчейна" (который тут вообще не при чём, просто как иллюстрация к важности версионирования), и к нему на публичном API прикручены фронт-энды "моделеров". Всё как в софтверной разработке, только это не классические программы, а "модели" (тексты -- это тоже модели того, что эти тексты описывают, и тексты тоже могут быть показаны в самых разных по форме "документах").
Проблема версионирования знаний -- тут отдельная проблема. Она тесно связана с проблемой ontology revision (ибо у нас же мега-модель!). И ещё проблема с "попперовским AI" -- который перестаёт рассуждать по теории флогистона, когда её фальсифицируют. Пока таких AI (впрочем, и людей тоже -- нет тут веры в человечество) не замечено.
Всё это выглядит как некоторое "соглашение о моделировании" к coda.io или notion.so, и если бы были эти движки в варианте open source, то можно было бы просто их брать as is и дальше реализовывать проект на них. Но в открытом доступе такого нет, ценник на коммерческие версии SaaS запретительный. Поэтому пока просто ползём или хотя бы лежим в данном направлении.