Как устроить учёт персональных данных в ИИ-среде: "парламент" вместо "президента"

На днях в обсуждении прозвучал аргумент: «Не каждый захочет передавать свои данные ИИ-помощнику». Я задумался: а кого именно этот “некаждый” хочет обмануть? Государство уже знает о нём больше, чем он сам помнит. Вендоры, через которых он покупает, ищет и переписывается, хранят его цифровой след за последние десять-пятнадцать лет. Банк знает его доходы, телеком знает его перемещения, социальные сети знают его связи. Отказ передать данные ИИ-помощнику не защищает приватность, потому что данные уже распределены по десяткам систем. Кого вы обманываете, отказываясь передать данные ИИ? Только себя. Вопрос не в том, передавать ли. Вопрос в том, кто управляет доступом к этим данным и как правильно организовать учет, обновления и доступ к этим данным. Это особенно важно для персональных ИИ-помощников (ассистентов, IWE и тп), которым необходимы ваши данные чтобы быть полезными.

Я начал искать аналогию и нашёл её в неожиданном месте. Вернулся на 2 десятилетия назад. Вначале 2000-х годов мы с Анатолием Левенчуком, Виктором Агроскиным, Вадимом Новиковым, Алексеем Каптеревым и группой коллег проектировали архитектуру электронного государства. Проект назывался «Электронная Россия», и в нём была одна идея, которая опередила своё время на двадцать лет. Во всяком случае для нас с точки зрения реализации. Нам тогда не удалось ее применить для всей страны, но зато теперь мы можем применить ее для личных ИИ-помощников, потому что на разных системных уровням много устроено одинаково. Государственные данные или личные данные человека могут управляться по одинаковым «законам», принципам и методам.

В частности, мы тогда предлагали разделить государственную информацию на три института: учёт, доступ и аудит. Не одно ведомство хранит всё или все могут просто так передавать данные друг другу. Каждое ведомство ведёт учёт в своей зоне ответственности на основании закона. Законы и отдельный институт регулирует, кто и к каким данным имеет доступ. Третий институт проверяет, что первые два соблюдают правила. По сути, это «разделение властей» для ваших данных для управления личной информацией. Ведь и вы хотите чтобы все ваши данные по медицине, финансам, образованию и тп работали на вас, но при этом были защищены. Этот опыт из 2006 года объяснил для меня будущее ИИ-помощников лучше, чем большинство современных статей о приватности.

Когда я посмотрел на эту триаду, я увидел в ней архитектуру персонального ИИ-помощника будущего.

Доменная область определяет информацию, которая доступна определенному ведомству. У человека тоже может быть что-то по аналогии с госорганом. Представьте, что ваши персональные данные распределены по доменным областям: здоровье, образование, финансы, семья, карьера. В каждой области — отдельное «ведомство» или ИИ-агент, который ведёт учёт строго в своих границах. Ваш медицинский ИИ-агент знает этот домен: знает результаты анализов, но не знает банковский баланс. Образовательный домен знает прогресс в курсах, но не знает диагнозы. Они не дублируют информацию между собой, потому что это создало бы проблему синхронизации. Один факт живёт в одном месте, но доступен для определенных сценариев и при этом все действия журналируются.

Парламент определяет, что делает правительство и конкретные ведомства. В государстве парламент принимает законы, которые устанавливают: какое ведомство какие данные ведёт, кто к чему имеет доступ, при каких условиях и в каких сценариях допускается межведомственный обмен. Для персонального ИИ-помощника как совокупности ИИ-агентов (ведомств) вы определяете эти правила: какой агент имеет доступ к каким данным, в каком порядке, при каких условиях. ИИ-помощник всё это реализует, следит за тем, чтобы данные не утекали и любой доступ был санкционированным. Для этого работают аудит и верификация. Результат — протоколы и политики доступа — это «законы» вашего персонального ИИ-государства. Они не рекомендации, а обязательные проверки, без прохождения которых действие блокируется.

Почему один ИИ-агент не должен знать о вас всё. В правильно устроенном ИИ-помощнике нет одного агента, который знает всё и имеет доступ сразу ко всем данным, но он может запросить их в рамках сценариев. Еще есть координатор, который управляет работой, но не хранит данные. Он знает, к какому домену обратиться за ответом, но не копирует данные к себе. Это принципиальное ограничение: всю информацию в одном месте собрать нельзя. Не потому что технически невозможно, а потому что архитектурно запрещено. Как президент в парламентской республике или правительство — они не могут единолично принимать законы и получать любую информацию без ограничений. Один агент с полным доступом ко всему — это не помощник, это катастрофа и риск. Распределённая система с протоколом — это архитектурная гарантия.

Аудит как независимая проверка. Третий институт из триады «учёт, доступ, аудит» — это независимый верификатор. Он работает в изоляции от основных агентов: проверяет результат, а не процесс создания. Он не может изменить данные, но может подтвердить, что правила соблюдены. Как аудитор, который проверяет бухгалтерию, но не ведёт её. И это совсем отдельный ИИ-агент со своим контекстом (доменной областью).

Государство Персональный ИИ-помощник
Ведомство (ведёт учёт в своей зоне) Доменная область (здоровье, финансы, образование)
Парламент (определяет правила для ведомств) Вы (определяете правила доступа для агентов)
Законы Протоколы и политики доступа
Президент (ограниченный) или правительство Координатор (маршрутизирует, но не хранит данные)
Аудит Независимый верификатор (проверяет в изоляции)
Инфраструктура доверия (удостоверяющие центры) Авторизация между агентами (OAuth, сертификаты)

Чему ИИ-помощники могут научиться у государства. Когда человек говорит «я не хочу передавать свои данные ИИ», он мыслит моделью президента: один агент, одна точка доступа ко всему. Конечно, это пугает. Но вопрос можно поставить иначе: а что если ваш ИИ-помощник устроен как парламент и распределенные ведомства? Не один агент, а распределённая система. Ваш «финансовый агент» знает доходы, но не знает медицинские данные. Ваш «учебный агент» знает прогресс в курсах, но не знает банковские реквизиты. И между ними работает протокол (закон), который определяет, какой агент может запросить какую информацию у какого другого агента, при каких условиях и с какой целью.

Минимальное количество независимых агентов определяется количеством доменных областей с разной конфиденциальностью. Например, у вас пять областей (здоровье, образование, финансы, семья, карьера), вам нужно минимум пять изолированных доменных агентов, плюс один координатор (видит агрегаты, но не сырые данные), плюс один верификатор. Итого: число доменов плюс два (минимум). При этом один и тот же агент может исполнять разные роли — стратега, аналитика, исполнителя — внутри своего домена. Но доменный агент в роли стратега по здоровью физически не видит домен финансов. А координатор в роли стратега видит витрины (агрегаты) из нескольких доменов для принятия кросс-доменных решений, но не сырые данные.

Это и есть исследование, которое я начинаю. Фазы: маппинг государственных институтов на компоненты персональных ИИ-помощников (уже начато, хотя опыт государства тут не единственный источник, но хорошая метафора), архитектурная концепция протокола межагентного доступа, фиксация как доменное знание. Цель не теоретическая, она в том, чтобы каждый пользователь мог сказать: мои данные распределены, доступ регулируется, аудит независим и я доверяю свои данные ИИ-помощнику. Не доверие одному агенту, а архитектурные гарантии.


Источник аналогии: архив ФЦП «Электронная Россия» (2002-2010), Концепция регулирования государственного учёта, вер. 2.0 (июнь 2006) — elrussia.ru

3 лайка

Очень интересное начинание.
Аналогия между доменами знания и министерствами - вполне релевантная считаю.
Хочется даже отправить ссылку на этот пост одному специалисту по парламентаризму… Вдруг её такая аналогия заинтересует.
Буду следить за исследованием с интересом.

1 лайк

Этой идее уже более 20 лет), и она в развитых странах уже даже реализована, хотя и идеально. Но на уровне личных данных мы это можем попробовать сделать все правильно). Все возвращается на круги своя.