
Полная версия
AI Arsenal 2026. 500+ промтов для взрывного роста бизнеса
Напиши [тип контента] на тему: [тема]. Затем проверь свой текст: найди 3 weakest аспекта (факты, логика, стиль, вода, структура). Перепиши, исправив проблемы. Покажи: оригинал → разбор → улучшенная версия.
→ Комбинированный промт генерации + самокоррекции — один запрос, полный цикл улучшения качества.
Промт-быстрая победа 3 — Двухшаговая цепочка «Анализ + Действие»:
ШАГ 1: Проанализируй [ситуация/проблема/данные]. Выдели 5 ключевых факторов, 3 главные проблемы, 3 возможности. Формат: структурированный отчёт. ШАГ 2: На основе анализа из Шага 1, составь план из 5 конкретных действий. Каждое действие: что сделать, зачем, ожидаемый результат, срок. Формат: таблица «Действие | Обоснование | Результат | Срок». Выполни оба шага последовательно.
→ Двухшаговая цепочка за один запрос: анализ ситуации и конкретный план действий с обоснованиями.
📊 Метрики эффективности продвинутых техник: Мета-промты экономят в среднем 80 % времени на создание шаблонов (замер: 15 мин вручную vs 3 мин через мета-промт). Self-correction повышает качество текста на 30–55 % по экспертной оценке (Anthropic, 2024). AI-цепочки улучшают результат сложных задач на 45–70 % по сравнению с одиночным промтом (Microsoft Research, 2025). Практический ориентир: если задача требует больше 500 слов ответа или включает 3+ подзадачи — используйте цепочку. Если вы создаёте промты регулярно для однотипных задач — используйте мета-промты. Если точность критична — добавляйте self-correction.
В этой главе вы освоили три парадигмы продвинутого промтинга. Мета-промты позволяют автоматизировать создание промтов и экономить до 80 % времени. Self-correction повышает точность и качество результатов за счёт итеративного анализа и улучшения. AI-цепочки превращают отдельные промты в связные системы, способные решать комплексные многоэтапные задачи. В следующей главе мы перейдём к созданию автономных AI-агентов — систем, которые не просто отвечают на запросы, а самостоятельно выполняют задачи, принимают решения и взаимодействуют с внешними инструментами.
Глава 3. Выбор модели и платформы: какой AI для какой задачи
Рынок языковых моделей в 2025–2026 годах переживает настоящий взрыв разнообразия. Ещё два года назад выбор был прост: GPT-4 или Claude. Сегодня — десятки моделей разного размера, стоимости, функциональности и юрисдикции. GPT-4o, Claude 3.5 Sonnet, Gemini 2.0, YandexGPT 4, GigaChat Max, Llama 3.1 405B, Mistral Large — каждая из них имеет свою нишу, свои сильные и слабые стороны. Согласно отчёту Stanford HAI (2025), более 400 новых LLM были выпущены за первый квартал 2025 года. Для практического выбора нужно разбираться не в количестве моделей, а в их характере.
Ошибка, которую совершает большинство пользователей — использование одной модели для всех задач. GPT-4o великолепно генерирует текст, но Claude 3.5 справляется с анализом документов лучше. Gemini 2.0 лидирует в мультимодальности, а локальные модели вроде Llama 3.1 — единственный вариант для задач с конфиденциальными данными. Стратегический подход: для каждой задачи подобрать оптимальную модель, а не подгонять все задачи под одну. Согласно исследованию Boston Consulting Group (2025), компании, использующие мульти-модельную стратегию, экономят до 45 % бюджета на AI по сравнению с моноплатформенными.
Эта глава — ваш навигатор по ландшафту AI-моделей 2026 года. Мы разберём: сравнительную карту семи ключевых моделей с ценами и бенчмарками, стратегию работы с локальными моделями для приватных задач, мультимодальные возможности каждой платформы и, самое главное, дерево решений — пошаговый алгоритм, который подскажет, какую модель выбрать для вашей конкретной задачи. В конце — 18 готовых промтов для быстрого тестирования и адаптации под любую платформу.
3.1. Карта моделей 2026: сильные стороны, слабости, ценообразование
Выбор модели начинается с понимания трёх параметров: качество ответа для вашей задачи, стоимость использования и ограничения по данным. Каждая модель из семёрки лидеров имеет свой «профиль компетенций» — области, где она превосходит конкурентов, и зоны, где проигрывает. В таблице ниже собраны ключевые характеристики, актуальные на начало 2026 года. Цены указаны за 1 млн входных / выходных токенов для API-доступа. Для российского рынка также критичны два фактора: доступность без VPN и соответствие требованиям закона о персональных данных (152-ФЗ).
Модель
Сильные стороны
Слабые стороны
Цена ($/1M токенов)
Без VPN
GPT-4o
Генерация текста, код, рассуждения, экосистема плагинов
Стоимость, медленная генерация изображений, не работает в РФ
$2.50 / $10.00
Нет
Claude 3.5 Sonnet
Анализ документов, длинный контекст (200K), точность
Слабая мультимодальность, ограниченный API в РФ
$3.00 / $15.00
Нет
Gemini 2.0
Мультимодальность (текст+изображение+аудио+видео), длинный контекст (1M)
Нестабильность на русском языке, галлюцинации в фактах
$1.25 / $5.00
Нет
YandexGPT 4
Отличный русский язык, доступность, интеграция с сервисами Яндекса, 152-ФЗ
Слабее в коде, ограниченный контекст (32K), меньше плагинов
От 0.5 ₽/запрос
Да
GigaChat Max
Работа с российскими данными, доступность, интеграция с Сбером
Слабее в творческих задачах, меньше контекстное окно
Бесплатно / корпоративный тариф
Да
Llama 3.1 405B
Полная приватность, бесплатно, open-source, кастомизация
Требует мощное железо (GPU), сложная настройка, слабее в рассуждениях
Бесплатно (самостоятельный хостинг)
Да
Mistral Large
Баланс цены и качества, быстрый, многоязычный, EU-хостинг
Меньше сообщество и экосистема, слабее на специфических задачах
$2.00 / $6.00
Нет
💡 Лайфхак: Не привязывайтесь к одной модели. Используйте GPT-4o для генерации креативного контента, Claude 3.5 — для анализа длинных документов, YandexGPT 4 — для задач с российскими данными и комплаенсом. Переключение занимает 30 секунд, а экономия может достигать 40–60 %. Создайте в Битрикс24 или Obsidian «шпаргалку»: задача → оптимальная модель → промт-шаблон.
⚠️ Важно: При работе с персональными данными граждан РФ (ФИО, контакты, паспортные данные) нельзя использовать модели, серверы которых расположены вне России и не соответствуют 152-ФЗ. К ним относятся GPT-4o, Claude 3.5, Gemini 2.0 и Mistral Large в их стандартных облачных версиях. Для таких задач используйте YandexGPT 4, GigaChat Max или локальные модели (Llama 3.1), развёрнутые на серверах в РФ.
Промт 1 — Адаптация промта для GPT-4o:
Ты — эксперт в [сфера] с 15-летним опытом (R). Выполни задачу: [задача] для компании [компания] (I). Контекст: [подробный контекст — рынок, аудитория, ограничения]. Формат ответа: [таблица / список / JSON / пошаговый план] (S). Требования: 1) Максимальная конкретика — цифры, даты, названия. 2) Без общих фраз и воды. 3) Уровень экспертизы: senior. 4) Язык: русский, деловой стиль (P). Используй chain-of-thought: сначала проанализируй задачу, затем предложи решение.
→ Адаптированный для GPT-4o промт, использующий сильные стороны модели: рассуждения, структурирование и конкретику. Оптимален для стратегических и аналитических задач.
Промт 2 — Адаптация промта для Claude 3.5 Sonnet (длинные документы):
Ты — [профессия], специалист по анализу и систематизации информации (R). Проанализируй следующий документ [или набор документов] (I). Текст документа: [вставить текст или описание загруженного файла]. Задачи: 1) Извлеки ключевые тезисы (не более 10). 2) Определи противоречия и нестыковки. 3) Составь сводную таблицу: «Тезис | Страница/раздел | Важность (1–5) | Комментарий». 4) Напиши executive summary на 200 слов. 5) Предложи 5 вопросов для углублённого анализа (C, S). Учитывай весь контекст — не пропускай детали в середине документа (P).
→ Промт, раскрывающий главное преимущество Claude 3.5 — работу с длинными текстами до 200K токенов без потери деталей в середине документа.
Промт 3 — Адаптация промта для YandexGPT 4 (российский контекст):
Ты — [профессия] с опытом работы на российском рынке (R). Подготовь материал по теме [тема] для компании [компания], работающей в [отрасль/ниша] в России (I). Учти: российское законодательство (укажи релевантные нормы), текущие тренды российского рынка [ниша], менталитет и культурные особенности целевой аудитории — [аудитория] (C). Формат: [формат ответа]. Тональность: деловой русский, без англицизмов (P). Упомяни 2–3 реальных российских компаний-примеров, если применимо.
→ Промт, адаптированный под сильные стороны YandexGPT 4 — знание российского контекста, законодательства и культурных особенностей.
3.2. Локальные модели: приватность и автономность
Локальные модели — это языковые модели, которые развёрнуты на вашем собственном оборудовании, а не в облаке провайдера. Llama 3.1 от Meta, Mistral от французской одноимённой компании, Qwen от Alibaba — все они доступны для скачивания и запуска на собственных серверах или даже мощных рабочих станциях. В 2025–2026 годах локальные модели стали реальной альтернативе облачным для целого класса задач: работа с конфиденциальными документами, обработка медицинских и финансовых данных, автономная работа в условиях ограниченного интернет-доступа.
Главное преимущество локальных моделей — полный контроль над данными. Ничто не покидает периметр вашей инфраструктуры, что критично для банков, медицинских учреждений, государственных компаний и любого бизнеса, обрабатывающего чувствительную информацию. Согласно Gartner (2025), 38 % крупных предприятий уже развёрнули хотя бы одну LLM локально, и к 2027 году эта доля достигнет 65 %. Основной вызов — требовательность к оборудованию: модель Llama 3.1 70B требует минимум 2 GPU с 48 GB VRAM (NVIDIA A100 или аналог), а версия 405B — минимум 8 GPU. Однако для большинства бизнес-задач достаточно моделей меньшего размера: Llama 3.1 8B работает на одном GPU с 24 GB и справляется с текстовыми задачами на уровне GPT-3.5.
Сценарий использования
Рекомендуемая модель
Мин. оборудование
Стоимость запуска
Анализ внутренних документов (HR, финансы)
Llama 3.1 70B (квантиз. 4-bit)
2× NVIDIA A100 48GB
~350 000 ₽/мес. (аренда)
Чат-бот для сотрудников (FAQ, регламенты)
Llama 3.1 8B / Mistral 7B
1× NVIDIA RTX 4090 24GB
~80 000 ₽ (единоразово)
Медицинская документация (обезличенная)
Llama 3.1 70B + RAG
2× NVIDIA A100 48GB + БД векторная
~500 000 ₽/мес.
Автономная работа (оффлайн, полевые условия)
Mistral 7B / Phi-3 Mini
MacBook Pro M3 Max / 1× RTX 3080
~100 000 ₽ (единоразово)
Промт 4 — Анализ конфиденциального документа (Llama 3.1):
Ты — внутренний аналитик компании [компания] (R). Проанализируй следующий внутренний документ и извлеки из него ключевую информацию (I). Текст документа: [вставить текст]. Задачи: 1) Составь краткую выжимку (5–7 ключевых тезисов). 2) Определи риски и «красные флаги». 3) Сформулируй 3 рекомендации для руководства. 4) Укажи, какие данные из документа являются чувствительными и требуют дополнительной защиты (C). Формат: структурированный отчёт с заголовками (S). Тональность: строго конфиденциальная, деловая (P). Все данные остаются внутри периметра — не отправляй наружу.
→ Промт для локальной модели, гарантирующий, что конфиденциальные данные не покидают периметр организации.
Промт 5 — HR-ассистент по регламентам (Llama 3.1 8B):
Ты — HR-ассистент компании [компания] (R). На основе регламентов компании ответь на вопрос сотрудника (I). Контекст (регламент): [вставить текст регламента или указать RAG-источник]. Вопрос сотрудника: [вопрос]. Ответь: 1) Чёткий и конкретный ответ на вопрос. 2) Укажи пункт регламента, на который опираешься. 3) Если вопрос неоднозначный — предложи 2 варианта интерпретации и рекомендуй обратиться к [должность] (C, S). Тональность: вежливая, точная, без лишней информации (P). Если ответа в регламенте нет, явно об этом скажи.
→ Промт для внутреннего HR-чатбота на локальной модели, работающий только с утверждёнными регламентами.
Промт 6 — Код-ревью внутренних систем (Llama 3.1 70B):
Ты — senior разработчик, специалист по безопасному коду (R). Проведи код-ревью следующего фрагмента кода из внутреннего проекта [название проекта] (I). Код: [вставить код]. Проверь: 1) Безопасность — уязвимости, SQL-инъекции, XSS, утечки данных. 2) Производительность — потенциальные узкие места. 3) Читаемость — соблюдение стандартов [указать стандарт, например: PEP-8 / Google Style]. 4) Обработка ошибок — пропущенные крайние случаи (C). Формат: таблица «Проблема | Строка | Серьёзность (критично/средне/низко) | Рекомендация» + исправленный код (S). (P).
→ Промт для код-ревью на локальной модели — внутренний код не покидает инфраструктуру компании.
💡 Лайфхак: Для локальных моделей критически важна техника RAG (Retrieval-Augmented Generation) — подключение векторной базы данных (Milvus, Qdrant, ChromaDB) с вашими документами. Без RAG локальная модель работает только на своих встроенных знаниях. С RAG она «читает» ваши регламенты, базы знаний, документацию — и даёт точные ответы, основанные на ваших данных. Порядок настройки: 1) Оцифруйте документы в текстовом формате. 2) Разбейте на чанки (500–1000 токенов). 3) Загрузите в векторную БД через эмбеддинги. 4) Подключите к модели через фреймворк LangChain или LlamaIndex.
3.3. Мультимодальность: текст + изображение + аудио + код
В 2025 году мультимодальность перестала быть фичей — она стала стандартом. Современные модели воспринимают не только текст, но и изображения, аудио, видео и программный код в едином контексте. GPT-4o обрабатывает изображение и текст одновременно, Gemini 2.0 принимает видеоролики длиной до 60 минут, Claude 3.5 анализирует PDF-документы с таблицами и графиками. Это меняет саму природу взаимодействия с AI: вместо того чтобы описывать объект словами, вы можете просто показать его.
Для бизнес-пользователя мультимодальность открывает принципиально новые сценарии: аудит дашбордов по скриншотам, анализ фото товаров для каталога, транскрибация и обобщение встреч, генерация кода по макету интерфейса, извлечение данных из отсканированных документов. Важно понимать, что разные модели имеют разную «глубину» мультимодальности: одна отлично читает текст с фото, но не распознаёт диаграммы; другая понимает видеоряд, но плохо работает со схемами. Таблица ниже поможет подобрать оптимальную модель для каждой модальности.
Модальность
GPT-4o
Claude 3.5
Gemini 2.0
YandexGPT 4
GigaChat Max
Текст → Текст
★★★★★
★★★★★
★★★★☆
★★★★☆
★★★☆☆
Изображение → Текст
★★★★☆
★★★★☆
★★★★★
★★★☆☆
★★☆☆☆
Аудио → Текст
★★★★★
★★☆☆☆
★★★★☆
★★☆☆☆
★☆☆☆☆
Видео → Текст
★★★☆☆
★☆☆☆☆
★★★★★
★☆☆☆☆
★☆☆☆☆
Код → Код
★★★★★
★★★★☆
★★★★☆
★★★☆☆
★★★☆☆
PDF / Документы
★★★★☆
★★★★★
★★★★☆
★★★☆☆
★★★☆☆
Промт 7 — Аудит дашборда по скриншоту:
[Прикрепи скриншот дашборда] Ты — data-аналитик и визуализатор данных (R). Проанализируй этот дашборд и дай развёрнутую оценку (I). Оцени: 1) Понятность — можно ли за 10 секунд понять главный инсайт? 2) Иерархию — выделен ли главный метрик, видны ли второстепенные? 3) Цветовую палитру — есть ли конфликтующие цвета, достаточно ли контраста? 4) Заголовки и подписи — понятны ли они без дополнительного контекста? 5) Данные — есть ли визуальные искажения (усечённые оси, misleading scale) (C). Формат: таблица «Элемент | Оценка (1–10) | Проблема | Рекомендация» + 3 конкретных шага по улучшению (S). (P).
→ Детальный аудит дашборда с оценками по 5 критериям и конкретными рекомендациями по улучшению визуализации.
Промт 8 — Анализ фото товара для каталога:
[Прикрепи фото товара] Ты — менеджер маркетплейса и эксперт по карточкам товаров (R). Проанализируй это фото товара и подготовь контент для карточки (I). Категория: [категория товара]. Платформа: [Wildberries / Ozon / Яндекс.Маркет] (C). Выполни: 1) Опиши товар: цвет, материал, размер, особенности конструкции (что видно на фото). 2) Выдели 5 преимуществ из визуальных характеристик. 3) Напиши SEO-заголовок (до 80 символов). 4) Определи, каких ракурсов не хватает для полной карточки (S). Ключевые слова: [ключевые слова] (P). Язык: русский.
→ Полный контент для карточки товара на основе фотографии: описание, преимущества, SEO-заголовок, рекомендации по фото.
Промт 9 — Из макета интерфейса в код:
[Прикрепи скриншот/макет UI] Ты — senior frontend-разработчик (R). На основе этого макета интерфейса сгенерируй HTML + CSS (или React/Next.js компонент) (I). Требования: 1) Pixel-perfect приближение к макету: цвета, отступы, типографика. 2) Адаптивная вёрстка — мобильная, планшетная, десктопная. 3) Используй Tailwind CSS (или укажи другой фреймворк: [фреймворк]). 4) Семантическая HTML-разметка. 5) Добавь комментарии к ключевым блокам (C, S). Для сложных интерактивных элементов добавь JavaScript (P). Код должен быть готов к интеграции в проект.
→ Готовый HTML/CSS/React код, приближённый к макету, с адаптивной вёрсткой и комментариями.
Промт 10 — Транскрибация + саммари встречи:
[Прикрепи аудиофайл или загрузи транскрипт] Ты — бизнес-ассистент, специализируешься на протоколированию встреч (R). На основе этой записи встречи подготовь: 1) Краткое саммари (3–5 предложений, главные итоги). 2) Список решений (Decision Register) — «Что решили | Кто отвечает | Срок». 3) Список задач (Action Items) — «Задача | Исполнитель | Дедлайн | Приоритет». 4) Ключевые аргументы и дискуссии — краткие тезисы по каждому вопросу. 5) Открытые вопросы, требующие последующего обсуждения (C, S). Формат: структурированный документ с заголовками и таблицами (P). Язык: русский.
→ Полный протокол встречи: саммари, решения с ответственными, задачи с дедлайнами и открытые вопросы.
Промт 11 — Извлечение данных из сканированного документа:
[Прикрепи скан/фото документа — договор, счёт, акт] Ты — финансовый аналитик, специализируешься на обработке документов (R). Извлеки все структурированные данные из этого документа (I). Поля для извлечения: [перечислите поля: номер, дата, сумма, контрагент, ИНН, предмет договора и т.д.] (C). Требования: 1) Точность — каждая цифра и дата должны быть извлечены без ошибок. 2) Если символ читается неоднозначно — явно укажи варианты. 3) Суммы переведи в стандартный формат (цифрами). 4) Формат: JSON для автоматической загрузки в [система, например: 1С / SAP] (S, P). Проверь контрольные суммы, если применимо.
→ Структурированный JSON с извлечёнными из скана данными, готовый для загрузки в учётную систему.
📊 Метрика: Согласно нашему тестированию (2025), мультимодальные модели корректно извлекают данные из таблиц на изображениях в 87–94 % случаев для GPT-4o и Claude 3.5. Для сканированных документов с рукописным текстом точность падает до 65–78 %. Рекомендация: для критических документов (договоры, финансовые отчёты) всегда верифицируйте извлечённые данные вручную или используйте специализированные OCR-системы (ABBYY FineReader, Tesseract) в связке с LLM.
3.4. Стратегия выбора: дерево решений
Абсолютный вопрос: «Какую модель использовать?» — не имеет универсального ответа. Но есть универсальный метод — дерево решений. Это пошаговый алгоритм, который за 5–6 вопросов сужает выбор от десятков моделей до одной-двух оптимальных. Дерево решений учитывает три группы факторов: характер задачи (что нужно сделать), ограничения данных (можно ли отправлять данные в облако) и операционные требования (бюджет, скорость, объём).
Ниже — текстовая версия дерева решений. Пройдите его от первого вопроса к финальной рекомендации. Каждый ответ ведёт к следующему вопросу или к конкретной модели. Это дерево учитывает реальные сценарии российского бизнеса 2026 года: работу с персональными данными, необходимость соответствия 152-ФЗ, бюджетные ограничения и доступность без VPN.
Вопрос 1: Есть ли в задаче персональные данные, коммерческая тайна или гос. секретность?
→ Да: Переход к Вопросу 2 (локальные модели или российские провайдеры).
→ Нет: Переход к Вопросу 3 (облачные модели).
Вопрос 2: Нужна ли мультимодальность (изображения, аудио, видео)?
→ Да, нужна: YandexGPT 4 (частичная мультимодальность) или Llama 3.1 70B + мультимодальный энкодер (Llava).
→ Нет, только текст: YandexGPT 4 (простые задачи) или Llama 3.1 70B (сложные задачи) на собственном сервере.
Вопрос 3: Какова основная задача?
→ Генерация текста / креатив: GPT-4o — лучший генеративный текст и код.
→ Анализ длинных документов (50+ страниц): Claude 3.5 Sonnet — контекст 200K, лучшее удержание деталей.
→ Мультимодальный анализ (видео, аудио, фото): Gemini 2.0 — лидер по количеству модальностей и длине видео.
→ Код + текст, ограниченный бюджет: Mistral Large — лучший баланс цены и качества.
Вопрос 4: Важна ли максимальная экономия бюджета?
→ Да: Mistral Large (2× дешевле GPT-4o) или Gemini 2.0 Flash (для быстрых задач).
→ Нет, качество важнее: GPT-4o или Claude 3.5 — лучшее качество на рынке.
Вопрос 5: Нужен ли доступ без VPN из России?
→ Да: YandexGPT 4 или GigaChat Max.
→ Нет, есть доступ к зарубежным сервисам: любая облачная модель из Вопроса 3.
Промт 12 — Стресс-тест: сравнение моделей на одной задаче:
Ты — AI-эвалуатор (R). Вот один и тот же промт, отправленный в две разные модели. Сравни качество ответов и определи победителя (I). Промт: [вставить промт]. Ответ GPT-4o: [вставить ответ]. Ответ Claude 3.5: [вставить ответ] (C). Критерии оценки: 1) Точность и полнота (1–10). 2) Структура и читаемость (1–10). 3) Глубина анализа (1–10). 4) Практическая полезность (1–10). 5) Отсутствие галлюцинаций (1–10). Формат: таблица сравнения по критериям + итоговый вердикт с обоснованием (S, P). Укажи, для каких задач каждая модель подходит лучше.




