
Полная версия
Агенты среди нас. Как нанять нейросеть на работу и не уволиться самому
– Когда задача узкая и конкретная («Назови столицу Франции»), луч фонарика сфокусирован в узкую, яркую точку. Модель видит ответ кристально ясно. Вероятность ошибки стремится к нулю.
– Когда вы загружаете в модель «Один Большой Промпт» на 10 страниц с десятком разнородных задач, вы заставляете этот фонарик осветить сразу весь футбольный стадион.
– Что происходит с лучом? Он рассеивается. Свет становится тусклым. Модель вроде бы «видит» всё, но не видит ничего конкретно. Детали в тенях теряются. Инструкция «не использовать пассивный залог», написанная в середине промпта, просто тонет в информационном шуме.
Этот феномен научно подтвержден. В 2023 году исследователи из Стэнфорда (Nelson F. Liu et al.) опубликовали знаковую работу «Lost in the Middle» («Потерянные в середине»). Они доказали существование так называемой U-образной кривой производительности (U-shaped performance curve).
Суть открытия пугающая для бизнеса: LLM отлично запоминают то, что написано в самом начале промпта (Primacy Effect) и в самом конце (Recency Effect). Но информация, находящаяся в середине длинного контекста, проваливается в «слепую зону».
Если в вашем «Мега-Промпте» самое важное условие (например, «максимальный бюджет 5000$») находилось в середине текста, вероятность того, что модель его проигнорирует, достигает 60—70%.
Это не баг, это физика внимания. «Один Большой Промпт» физически не может обеспечить одинаково высокое качество выполнения для всех подзадач одновременно.
Три всадника промпт-апокалипсиса
Помимо технического ограничения внимания, монолитный подход порождает три критические проблемы, которые делают его непригодным для серьезного бизнеса.
1. Шизофрения ролей (Role Confusion)
В примере выше мы просили модель быть одновременно «агрессивным маркетологом» и «осторожным юристом». Для нейросети это взаимоисключающие векторы настройки вероятностей.
– Маркетолог требует высокой «Температуры» (Temperature> 0.7) – параметра, отвечающего за креативность, случайность и неожиданные обороты.
– Юрист требует нулевой «Температуры» (Temperature = 0) – параметра, обеспечивающего максимальную точность, детерминизм и сухость формулировок.
Когда вы запихиваете эти две роли в один промпт, модель вынуждена искать «среднее арифметическое». В результате вы получаете шизофренический продукт: договор с неуместными шутками и рекламный пост, написанный канцеляритом.
Невозможно быть одновременно клоуном и судьей в рамках одной сессии генерации. Универсальность убивает качество.
2. Эффект домино при ошибках (Error Propagation)
В «Одном Большом Промпте» все действия связаны в одну неразрывную цепь. Анализ, планирование, написание кода и его проверка происходят в одном потоке вывода.
Если модель совершает ошибку в самом начале (например, неправильно поняла входные данные), эта ошибка лавиной катится через весь ответ.
Модель не может остановиться, сказать «Ой, я ошиблась в первом абзаце» и переписать его. Она работает авторегрессионно – только вперед. Она будет героически строить логические замки на фундаменте из галлюцинаций.
В конце вы получаете огромный, красивый, связный текст, который полностью неверен, потому что первая предпосылка была ошибочной. В монолитной системе нет «точек сохранения» и «предохранителей».
3. Проблема «Черного ящика» (Debugging Nightmare)
Это боль всех, кто пытался внедрять ИИ в продакшн.
Вы написали сложный промпт. Клиент жалуется, что бот иногда грубит.
Где ошибка?
– Может, вы неудачно описали Tone of Voice?
– Может, модель неправильно интерпретировала вопрос клиента?
– Может, сработал защитный фильтр OpenAI?
– В «Большом Промпте» вы не можете изолировать проблему. Вы меняете одно слово в инструкции, и ломается всё остальное (эффект бабочки). Промпт-инжиниринг превращается в шаманизм: вы боитесь дышать на промпт, который «вроде бы работает». Это тупик для масштабирования.
Смерть «Швейцарского ножа»
Рынок долго верил в мечту об AGI (General Intelligence) – универсальном разуме, который умеет всё. Но практика 2025 года показывает, что бизнес-задачи лучше решают не универсалы, а узкие специалисты.
«Один Большой Промпт» – это попытка забивать гвозди микроскопом. Да, микроскоп тяжелый, им можно забить гвоздь. Но гвоздь будет кривой, а микроскоп сломается.
Мы переходим от парадигмы «Супер-Модель, которая делает всё» к парадигме «Команда средних моделей, каждая из которых делает одно дело идеально».
Вместо того чтобы растягивать внимание модели на километр, мы нарезаем задачу на 10 маленьких кусочков, где для каждого кусочка внимание сфокусировано на 100%.
Именно неспособность одной модели удерживать в голове сложный контекст и привела к рождению мультиагентных систем. Мы перестали бороться с природой нейросетей и начали использовать её сильные стороны.
Мы поняли: чтобы написать книгу, не нужен один гений. Нужен редактор, писатель, корректор и фактчекер. И они не должны жить в одной голове.
Разделяй и властвуй: как разбиение задачи на микро-роли повышает качество на 40%
Если «Один Большой Промпт» – это проблема, то каково решение? Ответ лежит в плоскости организационного управления, а не программирования. Решение называется Декомпозиция Агентных Ролей (Agentic Role Decomposition).
В исследовании, проведенном Microsoft Research в рамках проекта AutoGen (осень 2024), был зафиксирован поразительный результат. Группа из трех «слабых» агентов (на базе модели GPT-3.5), работающих по цепочке, решила сложные задачи по программированию и математике на 40% точнее, чем одна «сильная» модель (GPT-4), которой дали ту же задачу целиком.
Как такое возможно? Как три джуниора могут победить сеньора?
Секрет кроется в методологии «Разделяй и властвуй».
1. Гигиена Контекста (Context Hygiene)
Главное преимущество мультиагентной системы – чистота рабочей памяти каждого отдельного агента.
Когда мы разбиваем задачу, мы создаем для каждого агента свой, изолированный мир.
– Мир Агента-Аналитика: В его контексте лежат только сухие цифры, таблицы и отчеты. Ему запрещено думать о красоте слога. Его промпт короткий и жесткий: «Извлеки тренды из таблицы». Лучь его внимания (Self-Attention) бьет точно в цифры. Он не отвлекается.
– Мир Агента-Копирайтера: В его контексте нет таблиц. Ему не нужно тратить вычислительный ресурс на понимание цифр – он получает от Аналитика уже готовые выводы. В его контексте лежат только гайдлайны по стилю и примеры хороших текстов. Его внимание сфокусировано на метафорах и глаголах.
Разделяя контексты, мы устраняем «интерференцию навыков». Модель больше не пытается усидеть на двух стульях. Это повышает IQ каждого отдельного агента в рамках его узкой задачи. Специалист всегда бьет универсала на своем поле.
2. Сила дебатов и самокоррекции (Multi-Agent Debate)
Одиночная модель страдает от когнитивного искажения, известного как Confirmation Bias (Предвзятость подтверждения).
Если модель в начале ответа написала: «Земля плоская», она будет до конца текста придумывать аргументы в пользу этого тезиса, чтобы сохранить логическую связность (Coherence). Ей очень трудно сказать самой себе: «Стоп, я пишу чушь».
В мультиагентной системе мы внедряем механизм Состязательности (Adversarial Flow).
Мы специально создаем агента-врага. Агента-Критика.
Его единственная задача – не создавать, а разрушать. Он получает ответ первого агента и промпт: «Найди логические ошибки. Найди фактические неточности. Будь безжалостным».
Этот процесс имитирует научную дискуссию или защиту диссертации.
– Агент А выдвигает гипотезу.
– Агент Б разбивает её аргументами.
– Агент А вынужден пересмотреть гипотезу и выдать улучшенную версию.
Исследования MIT (статья «Improving Factuality and Reasoning in Language Models through Multiagent Debate») показывают, что даже 2 раунда таких дебатов снижают уровень галлюцинаций в 3 раза. Истина рождается в споре, и агенты умеют спорить гораздо эффективнее людей – без обид и перехода на личности.
3. Экономика токенов и выбор инструментов (Model Routing)
Разбиение на роли позволяет нам экономить деньги. Это циничный, но важный аспект бизнеса.
Зачем использовать «ядерный реактор» (дорогую модель вроде Claude 3 Opus или GPT-4o) для задачи перекладывания запятых?
В агентной архитектуре мы применяем принцип Model Routing (Маршрутизация моделей):
– Сложные задачи (Планирование, Креатив): Отдаем топ-моделям. Да, дорого, но тут нужен интеллект.
– Рутинные задачи (Саммаризация, Форматирование JSON, Проверка орфографии): Отдаем дешевым и быстрым моделям (Llama 3, Haiku, GPT-4o-mini).
Разделяя процесс на этапы, мы можем для каждого этапа нанять сотрудника соответствующей квалификации. Вы не нанимаете доктора наук, чтобы он мыл пробирки. Вы нанимаете лаборанта. Точно так же работает агентная сеть. Это снижает стоимость владения системой (TCO) в разы при сохранении качества финального продукта.
4. Стандартизация процессов (SOPification)
Внедрение агентов заставляет вас, как владельца бизнеса, сделать то, что вы откладывали годами: прописать SOP (Standard Operating Procedures).
Агенты не работают на абстракциях. Им нужен алгоритм.
Чтобы разделить задачу на микро-роли, вы должны сначала разложить свой бизнес-процесс на атомы.
– Не «Веди продажи», а: «1. Квалифицируй лид. 2. Проверь бюджет. 3. Подбери кейс. 4. Сформируй КП».
Этот процесс сам по себе лечит бизнес. Даже если вы завтра выключите ИИ, у вас останутся идеально прописанные регламенты.
Разделение задач превращает «творческий хаос» в «промышленный конвейер». А конвейер, как доказал Генри Форд, всегда эффективнее ремесленной мастерской.
Качество повышается на 40% не потому, что нейросети стали умнее. А потому, что вы, наконец, начали правильно ставить им задачи. Вы перестали требовать чуда от одного «волшебного промпта» и построили инженерную систему.
Пример из жизни: Как один агент пишет статью, второй – критикует, а третий – верстает (без участия человека)
Теория звучит убедительно, но давайте посмотрим, как это выглядит «в металле». Как именно эти невидимые сущности передают друг другу эстафетную палочку?
Мы разберем классический кейс для малого бизнеса: «Автономная новостная редакция».
Задача: У вас есть Telegram-канал или блог компании. Вы хотите каждый вторник публиковать экспертную статью с обзором новинок рынка.
Проблема: Это занимает 4—6 часов времени живого человека (поиск, чтение, написание, редактура, верстка).
Решение: Команда из трех агентов, которая делает это за 5 минут и 0.5$ стоимости токенов.
Встречайте нашу команду. У них нет имен, но есть Роли (System Prompts).
АКТ 1. ИЩЕЙКА (The Researcher)
Роль: Агент-Исследователь.
Инструменты:
– search_web (доступ к Google через API Serper/Tavily).
– scrape_url (читалка сайтов).
– Триггер: Таймер (Каждый вторник, 09:00 AM).
Внутренний монолог (Chain of Thought):
«Я получил задачу: найти главные новости по теме «Нейросети в ритейле» за последние 7 дней.
Шаг 1: Формирую запросы. «AI in retail news last week», «Walmart AI implementation 2025», «Amazon AI shopping trends».
Шаг 2: Делаю запрос к API Google… Найдено 15 ссылок.
Шаг 3: Читаю контент. Ссылка 1 – рекламный мусор, пропускаю. Ссылка 2 – серьезный отчет McKinsey, беру. Ссылка 3 – новость про Amazon, беру.
Шаг 4: Извлекаю факты. Мне не нужно писать текст. Мне нужно собрать «мясо». Цифры, даты, имена, цитаты.
Шаг 5: Формирую JSON-файл для следующего агента».
Артефакт на выходе (Output):
Агент-Исследователь не пишет статью. Он выдает сухой файл dossier. json. В нем нет ни капли эмоций, только структурированные данные:
{
«topic»: «AI in Retail»,
«key_findings»: [
{«source»: «TechCrunch», «fact»: «Amazon внедрил умные тележки в 50 магазинах», «date»: «12.12.2025»},
{«source»: «McKinsey Report», «fact»: «Внедрение ИИ снизило затраты на логистику на 15%», «link»: «…»}
]
}
АКТ 2. ДУШНИЛА (The Critic / Editor)
Роль: Агент-Редактор.
Инструменты: База знаний (Ваш Brand Book, примеры ваших лучших постов).
Входные данные: dossier. json от Исследователя.
Внутренний монолог:
*«Я получил досье. Теперь моя задача – проверить его на соответствие редакционной политике.
Проверяю факт №1 (Amazon). Это действительно новость или старый пресс-релиз? Ага, новость свежая. Подходит.
Проверяю факт №2 (McKinsey). Слишком скучно. Нужно найти пример, понятный малому бизнесу, а не корпорациям.
Решение: Я отвергаю факт №2 и прошу Исследователя найти пример для малого бизнеса.
(Цикл возвращается назад. Исследователь доискивает информацию).
…
Теперь все факты утверждены. Я составляю План Статьи (Outline).
– Вступление: Проблема очередей в магазинах.
– Основная часть: Как Amazon решает это (на базе факта 1).
– Вывод: Что делать обычному магазину?
– Важное примечание для Писателя: Не используй слово «инновационный», босс его ненавидит». *
Артефакт на выходе:
Файл outline_approved. txt с жесткой структурой и инструкциями.
АКТ 3. ТВОРЕЦ (The Writer / Formatter)
Роль: Агент-Копирайтер.
Инструменты: Нет (ему запрещено ходить в интернет, чтобы не нахвататься чуши).
Входные данные: outline_approved. txt и dossier. json.
Внутренний монолог:
«У меня есть утвержденный план и проверенные факты. Моя задача – просто превратить это в текст.
Я пишу в стиле «Информационный стиль». Короткие предложения. Без воды.
Использую факты из досье.
Вставляю шутку про кассиров во вступлении (разрешено гайдлайном).
Теперь верстка. Мне нужен Markdown.
Заголовки делаю через H2 (##).
Ключевые цифры выделяю жирным (15%).
Вставляю плейсхолдер для картинки:! [Робот с тележкой]».
Артефакт на выходе:
Готовый файл article_final.md, который можно копировать и вставлять в CMS.
ФИНАЛ: ЧЕЛОВЕК НА БАЛКОНЕ
В 09:05 вы получаете уведомление в Telegram.
«Шеф, материал готов. Исследователь нашел 3 новости, Критик забраковал одну, но утвердил две. Писатель сверстал текст. Прочитать и опубликовать?»
Под сообщением две кнопки: [Опубликовать] и [Переделать].
В чем магия этого примера?
– Отсутствие галлюцинаций. Писатель физически не может выдумать цифру, потому что у него нет доступа в интернет, он работает только с тем, что дал Исследователь. А Исследователь не пишет текст, он только копирует факты. Цепь разорвана в нужном месте.
– Стиль. Если вам не нравится стиль текста, вы меняете промпт только у третьего агента (Писателя). Исследователя и Критика трогать не надо. Система модульная.
– Скорость. Пока вы наливали кофе, три нейросети провели планерку, поссорились, помирились и сделали работу.
Это не фантастика. Такая схема (Researcher -> Critic -> Writer) – это «Hello World» агентных систем. Она собирается на No-Code платформах (вроде n8n или Make) за один вечер, а экономит сотни часов в год.
Именно так выглядит разделение труда в цифровую эпоху. Мы не заставляем одного робота делать всё. Мы строим конвейер, где каждый робот закручивает свою гайку, но делает это безупречно.
Часть II. Штатное расписание: Архитектура системы
Глава 3. Роль СЕО: Ваша новая работа
Как перестать быть «оператором промпта» и стать «архитектором системы»
В 2023 году мир разделился на две неравные группы. В первой, самой многочисленной, люди осваивали профессию «Промпт-инженера». Они учили заклинания: «Действуй как профессиональный копирайтер», «Используй метод Chain-of-Thought», «Дыши глубоко» (да, был и такой миф, что призыв к глубокому дыханию улучшает ответы нейросети). Эти люди гордились тем, что умеют «уговорить» машину выдать нужный результат.
Но была и вторая, крошечная группа людей. Они не писали длинных поэм в ChatGPT. Они рисовали квадратики и стрелочки на белых досках. Они не пытались стать лучшими собеседниками для бота. Они строили заводы, где боты работали у станков. Сегодня, в 2025 году, мы видим результат: первые остались с забавной, но умирающей профессией «оператора чата», а вторые стали владельцами автономных агентств.
Переход от Оператора к Архитектору – это самый сложный ментальный прыжок, который вам предстоит совершить в этой книге. Это отказ от микроменеджмента в пользу системного дизайна.
Ловушка «Волшебной Кнопки»
Почему так трудно перестать быть оператором? Потому что чат-интерфейс (Chat UI) – это наркотик. Он дает мгновенный дофаминовый отклик. Вы написали вопрос – через секунду получили ответ. Это создает иллюзию контроля и продуктивности.
– Оператор думает: «Я сейчас быстро сам всё напишу в чат, это быстрее, чем настраивать какую-то систему».
– Архитектор знает: «Любое действие, которое я делаю руками больше двух раз, должно быть превращено в алгоритм, иначе я становлюсь узким местом своего бизнеса».
Оператор работает в парадигме «Человек – > ИИ».
Архитектор работает в парадигме «Событие – > Система (Агент 1 + Агент 2) – > Результат».
Пять заповедей Архитектора ИИ-систем
Чтобы совершить этот переход, вам нужно перепрошить свое отношение к взаимодействию с машинами. Вот пять принципов, которые отличают системный подход от ручного труда.
1. Мыслить Потоками (Flows), а не Запросами (Prompts)
Оператор фокусируется на том, как спросить. Архитектор фокусируется на том, откуда приходят данные и куда они уходят.
Представьте, что вы строите водопровод.
– Промпт – это кран. Вы можете долго полировать ручку крана, чтобы она блестела. Но если к дому не подведена труба, воды не будет.
– Ваша задача – проложить трубы.
– Практика: Перестаньте открывать ChatGPT, когда возникает задача. Откройте блокнот или Miro. Нарисуйте кружочек «Входящее письмо». Нарисуйте стрелочку к квадратику «Анализ». От него – стрелочку к «Генерация ответа». Вы только что начали мыслить как архитектор. Вы создали граф выполнения, а не диалог.
2. Принцип «Стеклянного ящика» (Glass Box vs Black Box)
Когда вы переписываетесь с нейросетью в чате, это «Черный ящик». Вы не знаете, почему она ответила именно так. Вы не можете залезть ей в голову.
Архитектор строить систему как «Стеклянный ящик».
– Вместо одного гениального промпта «Сделай отчет», вы разбиваете процесс на 5 прозрачных шагов.
– Шаг 1: Извлеки цифры (мы видим этот файл).
– Шаг 2: Посчитай разницу (мы видим формулу).
– Шаг 3: Напиши выводы (мы видим текст).
– Если на Шаге 3 ошибка, вы не переписываете промпт целиком. Вы видите, что ошибка произошла на Шаге 1 (неверно извлечена цифра). Вы чините только этот узел. Архитектура дает контроль, которого лишен оператор.
3. Отказ от Детерминизма в пользу Вероятностей
Программисты привыкли: если A + B, то всегда C.
Архитектор ИИ понимает: если A + B, то C будет в 95% случаев, а в 5% нейросеть начнет цитировать Шекспира.
Ваша работа – не пытаться свести эти 5% к нулю (это невозможно), а построить «уловители ошибок» (Guardrails).
– Оператор: Злится, что нейросеть ошиблась.
– Архитектор: Ставит после нейросети блок-валидатор (простой код), который проверяет: «В ответе есть цифры? Если нет – верни на переделку». Вы проектируете систему с правом на ошибку, которая сама себя исправляет.
4. OODA Loop: Наблюдай, Ориентируйся, Решай, Действуй
Это военная концепция (петля Джона Бойда), которая идеально описывает работу автономного агента.
Оператор сам проходит этот цикл. Он читает письмо (Наблюдает), понимает его суть (Ориентируется), решает ответить (Решает) и пишет промпт (Действует).
Архитектор передает этот цикл машине.
– Наблюдение: Вебхук от CRM (пришла заявка).
– Ориентация: Классификация интента (клиент злой, добрый или просто спрашивает).
– Решение: Маршрутизация (злого – человеку, доброго – агенту-продажнику).
– Действие: API вызов (отправка сообщения).
– Ваша задача – настроить правила для фазы «Решение». Все остальное делает софт.
5. Масштабируемость как религия
Оператор линейн. Чтобы обработать 100 заявок, ему нужно в 100 раз больше времени.
Архитектор мыслит категориями масштаба.
«Если я построю эту систему для обработки одного отзыва, будет ли она работать для 10 000 отзывов, пока я сплю?»
Если ответ «Нет» (нужно что-то кликать руками) – это плохая архитектура. Архитектор не строит ничего, что требует его постоянного участия. Он строит только то, что работает автономно.
Практическое упражнение: Тест на Архитектора
Посмотрите на свою последнюю переписку с ChatGPT.
Если там есть фразы: «Нет, переделай», «Ты забыл про…», «Сделай короче» – вы Оператор. Вы тратите время на исправление брака в ручном режиме.
Архитектор бы сделал так:
– Увидел, что модель часто забывает про контекст.
– Добавил бы в систему шаг «Проверка контекста» перед генерацией.
– Добавил бы шаг «Авто-сокращение» после генерации.
– Больше никогда не писал бы эти замечания руками.
Стать архитектором – значит перестать играть в «Вопрос-Ответ» и начать играть в LEGO. Это переход от гуманитарного общения к инженерному конструированию. И именно за это рынок готов платить. За умение просить – платят копейки. За умение строить конвейеры просьб – платят миллионы.
Карта процессов: выявляем рутину, которую можно делегировать агентам
Прежде чем нанимать армию цифровых сотрудников, нужно понять, куда их расставить. Самая частая ошибка бизнеса – попытка автоматизировать хаос. «У нас бардак в продажах, давайте внедрим ИИ-агента, пусть он разберется».
Спойлер: Агент не разберется. Он просто автоматизирует бардак. Вы будете терять клиентов со скоростью света, 24/7, без перерывов на обед.
Чтобы этого не случилось, нам нужна Карта Процессов. Это рентгеновский снимок вашего бизнеса, который покажет, где прячутся деньги, а где – черные дыры времени.
Шаг 1. Охота на «Теневую работу» (Shadow Work)
В любой компании есть официальные должностные инструкции, а есть реальность.
Официально: «Менеджер ведет переговоры».
Реально: «Менеджер 30% времени ищет телефон клиента в старых письмах, 20% времени копирует данные из Excel в CRM, 10% времени правит запятые в договоре и только 40% – говорит».
Вот эти 60% – это «Теневая работа». Невидимая, неоплачиваемая (по сути), но неизбежная рутина.
Агенты созданы именно для уничтожения теневой работы.
Упражнение «Неделя с таймером»
Попросите ключевых сотрудников (или себя) в течение недели записывать каждое действие, которое длится больше 5 минут. Не задачи («Продажи»), а действия («Копировал email», «Искал файл», «Писал фоллоу-ап»).
Вы ужаснетесь. 80% действий – это работа курьера данных.
Шаг 2. Матрица Делегирования (Матрица Эйзенхауэра для ИИ)
Когда список действий готов, мы должны прогнать каждое действие через сито. Не всё можно и нужно отдавать агентам.
Используйте матрицу 2x2, где оси – это Сложность когнитивная (нужен ли мозг?) и Частотность (как часто это происходит?).
Квадрант 1: Высокая частота / Низкая сложность (Роботизация)
– Примеры: Ответы на частые вопросы (FAQ), копирование данных из заявки в CRM, выставление счетов, сбор статистики.
– Вердикт: Автоматизировать немедленно. Это идеальная еда для агентов. Тут даже не всегда нужны сложные LLM, часто хватит простых скриптов или дешевых моделей. Это зона мгновенной окупаемости.
Квадрант 2: Высокая частота / Высокая сложность (Augmentation – Усиление)
– Примеры: Написание персонализированных писем клиентам, анализ причин отказа, создание контента для соцсетей, техническая поддержка второго уровня.



