OpenAI построили упряжь для кода. Мы строим упряжь для интеллекта

OpenAI построили упряжь для кода. Мы строим упряжь для интеллекта

OpenAI на днях опубликовали статью «Harness Engineering», в которой описывают, как команда из 3-7 инженеров за 5 месяцев создала продукт объёмом в миллион строк кода. Ни одна строка не была написана человеком вручную. Всё писали ИИ-агенты (Codex). Средний темп — 3,5 pull request на инженера в день.

Но интересно не это. Интересно, чем занимались инженеры вместо написания кода.

Они проектировали среду. Не код, а среду, в которой агенты могут работать автономно. OpenAI назвали этот подход «harness engineering» — инженерия «упряжи».

Три компонента упряжи:

  1. Инженерия контекста. Всё знание, которое нужно агенту, должно быть внутри репозитория — не в головах людей, не в вики, не в Confluence. Документация становится навигационной картой, по которой агент прокладывает маршрут. Авторы называют это «agent legibility» — читаемость для агента.

  2. Архитектурные ограничения. Именно ограничения создают скорость без деградации. Каждый домен разделён на слои с валидируемыми направлениями зависимостей. Правила принуждаются механически — через линтеры и структурные тесты, а не через code review. Человеческий вкус фиксируется один раз (в правиле), а затем принуждается автоматически на каждой строке кода.

  3. «Сборка мусора». Техдолг — как кредит под высокий процент. Агенты периодически запускаются для обнаружения несоответствий, устаревших паттернов, нарушений ограничений. Плохие паттерны ловятся и исправляются ежедневно, а не распространяются неделями.

Ключевой принцип: когда агент спотыкается — это не дефект агента, а дефект среды. Нужно определить, чего не хватает — инструментов, ограждений, документации — и встроить это обратно в систему.

Исследователь Can Boluk подтвердил это экспериментально: изменение только обвязки (не модели!) улучшило результаты 15 языковых моделей на 5-14 процентных пунктов. Слабейшие модели получили наибольший прирост. Дело не в мощности модели, а в качестве среды.

Когда я прочитал эту статью, я понял, что описываю ровно то же самое — только не для кода, а для интеллектуальной работы.

Посмотрите на параллели:

У OpenAI — harness (упряжь) для ИИ-агента, который пишет код. У нас — экзокортекс, который является упряжью для интеллектуальной работы.

У OpenAI — context engineering: контекст локализован в репозитории. У нас — Pack и MCP: знания формализованы и навигабельны.

У OpenAI — архитектурные ограничения через линтеры. У нас — FPF/SPF: рамки корректности мышления.

У OpenAI — «сборка мусора», непрерывный рефакторинг. У нас — code-scan и Knowledge Extractor: непрерывная гигиена знаний.

У OpenAI — «ошибка агента = дефект среды». У нас — «ошибка мышления = дефект организации знаний».

У OpenAI — шаблоны harness как стандартные стартовые точки. У нас — template-exocortex: шаблон экзокортекса, который можно форкнуть за 15 минут.

Что это означает на практике?

Aisystant — это платформа, которая даёт каждому развернуть собственную IWE (Интеллектуальную рабочую среду). Это не инструкция «делай так». Это среда, в которой человек постепенно дорастает до способности менять мир: выявлять системы, которые нужны, создавать их и работать с системным мышлением.

Наши руководства — это именно маршрут роста. Как участник сообщества самостоятельно приходит к выявлению систем, которые он будет создавать, и как он научится работать с этим инструментарием.

OpenAI показали: дело не в мощности ИИ. Дело в среде, в которой он работает. Мы показываем то же самое: дело не в потенциальной мощности интеллекта, она примерно у всех одинакова. Дело в среде, в которой интеллект работает.

Harness engineering для кода — уже реальность. Harness engineering для интеллекта — это то, что строим прямо сейчас.

Источник: OpenAI, «Harness engineering: leveraging Codex in an agent-first world», 11 февраля 2026 — https://openai.com/index/harness-engineering/

4 лайка

К harness статье вообще много вопросов.
Где то в районе 60-100к строк кода уже становится ясно - включались ли инженеры активно с самого начала в проектирование/моделирование архитектуры, или нет.

Если нет - дальше тех долг будет расти чуть ли не экспоненциально, ну или… Кое как с теми же агентами будет переписываться и дописываться. Если все таки включались - то включались аутентично и полно!

Мне не нравится что об этом часто умалчиваются, у обычного читателя складывается ощущение магического момента.

Скорее всего дело в том что с точки зрения маркетинга может быть очень не выгодно в таких расходящихся статьях даже просто упоминать computer science и «старую добрую» программную инженерию.

2 лайка