
Полная версия
Создай голосового помощника. И научи бизнес летать
Кто производит: Компания Just AI (российская).
Что это такое: Aimylogic – это, пожалуй, самая популярная платформа в России для создания голосовых и текстовых ботов. Она существует с 2018 года и за это время стала стандартом де-факто для малого и среднего бизнеса.
Ключевые особенности:
– Визуальный конструктор: Вы просто перетаскиваете блоки на схеме. Выглядит как рисование блок-схемы в Word, только блоки живые.
– Понимание интентов: Платформа использует NLU (Natural Language Understanding), чтобы робот понимал смысл фраз, а не просто искал ключевые слова. Клиент может сказать «хочу заказать», «можно сделать заказ?», «как оформить покупку» – робот поймет, что это одно и то же.
– Гибридный подход: Можно использовать как жесткие сценарии (для важных процессов), так и нейросети для свободного диалога.
– Голоса: Собственная технология Aimyvoice – голоса звучат очень естественно, с интонациями и паузами.
– Интеграции: Легко подключается к CRM, телефонии (через SIP), мессенджерам.
Стоимость:
– Есть бесплатный тариф (для текстовых ботов и обучения).
– Для голосовых ботов – тарифы от 990 рублей в месяц за 100 уникальных пользователей или оплата за минуты разговора.
Плюсы для новичка:
– Огромное количество обучающих материалов и вебинаров.
– Понятный интерфейс на русском языке.
– Быстрый старт: можно сделать первого бота за час.
– Работает с российскими номерами телефонов без проблем.
Минусы:
– Для очень сложных сценариев может не хватить гибкости (но для 95% бизнеса – достаточно).
Вердикт: Если вы новичок и хотите быстро и без боли сделать первого голосового помощника – Aimylogic ваш выбор. Это та платформа, с которой стоит начинать.
2. Just AI Conversational Platform (JAICP): Профессиональный инструмент
Кто производит: Та же компания Just AI, но это более мощная платформа для сложных проектов.
Что это такое: Если Aimylogic – это «фотоаппарат для новичков» (наведи и снимай), то JAICP – это «профессиональная камера» с кучей настроек для тех, кто хочет снимать кино.
Ключевые особенности:
– Два режима: Можно создавать ботов в визуальном редакторе (J-Graph) или писать код на специальном языке JAICP DSL и JavaScript.
– NLU на стероидах: Очень мощные инструменты для понимания естественного языка, распознавания сущностей (дат, имен, адресов).
– Телефония «из коробки»: Полная поддержка звонков с функциями вроде barge-in (возможность прервать робота голосом).
– Enterprise-уровень: Подходит для крупных компаний с высокими нагрузками.
Для кого: Для среднего и крупного бизнеса, для компаний, которые планируют строить сложные многоуровневые системы, интегрировать с 1С, SAP и т. д.
Плюсы:
– Безграничные возможности настройки.
– Высокая надежность и производительность.
– Профессиональная поддержка.
Минусы:
– Сложнее для новичка.
– Цена выше (обычно обсуждается индивидуально).
Вердикт: Если ваш бизнес вырастет настолько, что Aimylogic станет тесен, вы легко переедете на JAICP – это экосистема одной компании.
3. Tovie AI: Амбициозный международный игрок
Кто производит: Tovie AI (ранее часть Just AI, теперь самостоятельная компания со штаб-квартирой в Лондоне).
Что это такое: Tovie Platform – это платформа для создания голосовых и текстовых ассистентов с фокусом на крупный бизнес и генеративный ИИ (ChatGPT и аналоги).
Ключевые особенности:
– Генеративный ИИ: Tovie активно использует большие языковые модели для создания более «живых» и умных диалогов.
– Agentic AI: Платформа позволяет создавать не просто ботов, а целые «системы агентов», которые могут решать сложные задачи с минимальным участием человека.
– Мобильные ассистенты: У Tovie есть интересное решение для мобильных операторов – ассистент, который может отвечать на звонки вместо абонента (защита от спама).
– Кроссканальность: Боты работают в телефонии, мессенджерах, чатах на сайтах, мобильных приложениях.
Интересный кейс: Tovie помог британским советам Richmond and Wandsworth создать помощника для людей, ухаживающих за пожилыми родственниками. Бот работает 24/7, помогает найти ресурсы и запросить оценку нужд.
Для кого: Для крупных компаний, банков, страховых, телеком-операторов, которым нужны передовые технологии и международный уровень.
Плюсы:
– Мощные генеративные возможности.
– Международное присутствие (подходит для компаний, работающих за рубежом).
– Инновационные фичи (Agentic AI).
Минусы:
– Ориентация на enterprise-клиентов (может быть сложно и дорого для малого бизнеса).
– Меньше «стартовых» материалов для абсолютных новичков.
Вердикт: Tovie – это платформа будущего для тех, кто хочет быть на острие технологий и готов за это платить.
4. Другие платформы (краткий обзор)
Помимо трех гигантов, есть и другие игроки, о которых полезно знать:
– Chatforma / Botmother / BotHelp: Это платформы, которые позиционируются как аналоги Aimylogic, но больше ориентированы на текстовых ботов для мессенджеров (Telegram, VK, Viber). Если вам нужен именно чат-бот на сайте или в соцсетях – посмотрите в их сторону.
– Bland AI: Американская платформа для корпоративных голосовых агентов. Ориентирована на замену целых колл-центров. Подходит для крупных компаний, готовых к полной автоматизации.
– Twilio / Amazon Connect / Google CC AI: Это «тяжелая артиллерия» для разработчиков. Они дают API и конструкторы, но требуют серьезных навыков программирования. Не для новичков.
Сравнительная таблица
Чтобы вам было проще ориентироваться, я собрал основные характеристики в таблицу.

Как сделать правильный выбор
Я не буду мучить вас выбором. Как опытный наставник, я дам вам простую рекомендацию:
Начинайте с Aimylogic.
Почему?
– Вы прочтете книгу и захотите сделать первого помощника прямо сейчас. Aimylogic позволит вам это сделать за вечер.
– У них щедрый бесплатный тариф для обучения и тестов.
– Вся документация и поддержка на русском.
– Это российская платформа, значит, никаких проблем с санкциями и валютой.
– Когда вы вырастете (а вы вырастете!), у вас будет бесшовный апгрейд до JAICP.
Aimylogic для голосовых помощников – это как WordPress для сайтов. Можно сделать простенький блог за час, а можно построить огромный портал. И начинать лучше с него.
Ваше домашнее задание
Дочитав эту главу, не откладывая, сделайте следующее:
– Зайдите на сайт Aimylogic (aimylogic.com) или developers.sber.ru (сейчас платформа развивается под эгидой Сбера).
– Зарегистрируйтесь (это займет 2 минуты).
– Посмотрите вступительный ролик или пройдите короткий тур по интерфейсу.
Не бойтесь ничего сломать. Это просто регистрация. Вы просто знакомитесь с инструментом, который станет вашим главным помощником на ближайшие месяцы.
Помните: выбор платформы – это не навсегда. Это просто первый шаг. Даже если через год вы перейдете на другую, опыт, полученный на Aimylogic, останется с вами. Главное – начать.
Глава 15. API ключи и доступы: Гайд по получению ключей к ChatGPT (OpenAI), YandexGPT или GigaChat
Представьте, что вы купили самый современный автомобиль. У него есть двигатель, руль, педали, но нет ключа зажигания. Вы можете сидеть в салоне, крутить руль, но машина не поедет.
Ваш конструктор голосовых помощников (Aimylogic, Tovie или другой) – это автомобиль. А API ключи – это ключи зажигания, которые запускают двигатель – нейросеть.
Без API ключа ваш помощник не сможет «думать». Он будет как человек без мозга – вроде есть рот и уши, а соображать нечем.
В этой главе мы разберем, как получить эти ключи для трех самых популярных нейросетей в России: ChatGPT (OpenAI), YandexGPT и GigaChat от Сбера.
Что такое API ключ простыми словами
API ключ – это уникальный пароль, который говорит нейросети: «Это я, свой, разреши мне задавать вопросы и получать ответы».
Когда ваш голосовой помощник хочет спросить у ChatGPT: «Как ответить клиенту на вопрос про цену?», – он предъявляет этот ключ. Если ключ правильный – нейросеть отвечает. Если нет – посылает ошибку.
Важнейшее правило безопасности:
Никогда, ни при каких обстоятельствах не публикуйте свой API ключ в интернете, не выкладывайте в открытый доступ, не отправляйте в чаты. Это ваш пароль от кошелька. Если кто-то его украдет, он сможет задавать вопросы нейросети за ваш счет.
Способ 1. ChatGPT (OpenAI): Ключ от мирового гиганта
OpenAI – самая популярная нейросеть в мире. Если ваш бизнес работает с международными клиентами или вам нужно максимальное качество ответов – выбирайте её.
Что нужно подготовить:
– Email (лучше корпоративный).
– Зарубежная карта или виртуальная карта (опционально, для оплаты).
– если вы в России, доступ к сайту может быть ограничен.
Пошаговая инструкция:
Шаг 1. Регистрация на платформе
Зайдите на официальный сайт platform.openai.com. Нажмите кнопку «Sign Up» и зарегистрируйтесь. Можно использовать Google или Microsoft аккаунт. Рекомендуют использовать корпоративную почту – это повышает шансы на успешную верификацию.
Шаг 2. Подтверждение телефона
Openai попросит подтвердить номер телефона. Важно: номер должен поддерживать международные SMS. Российские номера могут не работать. Если у вас возникли проблемы, можно воспользоваться сервисами виртуальных номеров.
Шаг 3. Создание API ключа
После входа в аккаунт перейдите в раздел «API Keys» (обычно находится в левом меню или в настройках профиля). Нажмите кнопку «Create new secret key».
Система сгенерирует длинную строку, похожую на: sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
Внимание! Openai покажет ключ только один раз. Скопируйте его сразу и сохраните в надежном месте (например, в менеджере паролей). Если потеряете – придется создавать новый.
Шаг 4. Настройка платежного аккаунта
Для работы API нужен платежный метод. Даже если вы планируете использовать бесплатный лимит, система может попросить привязать карту. Новым пользователям часто дают стартовый кредит (например, $5), но он ограничен по времени.
Совет: Настройте уведомления о расходах в панели управления, чтобы не получить неожиданный большой счет.
Где использовать в конструкторе:
В Aimylogic или другой платформе вы найдете поле «API Key OpenAI». Вставьте туда ваш ключ. Иногда также требуется указать эндпоинт (адрес сервера) – обычно это https://api.openai.com/v1.
Способ 2. YandexGPT: Российский мозг от Яндекса
YandexGPT – отличный выбор, если ваш бизнес работает в России, с русскоязычными клиентами. Она отлично понимает российский контекст и не требует зарубежных карт.
Что нужно подготовить:
– Аккаунт на Яндексе (почта).
– Паспортные данные (для создания платежного аккаунта в Yandex Cloud).
– Банковская карта (российская, для привязки к облаку).
Пошаговая инструкция:
Шаг 1. Регистрация в Yandex Cloud
Зайдите на cloud.yandex.ru. Нажмите «Создать аккаунт». Войдите через Яндекс ID. Вам нужно будет ввести номер телефона и подтвердить его.
Шаг 2. Создание платежного аккаунта
Для доступа к YandexGPT нужно создать платежный аккаунт. Не пугайтесь, это не значит, что вас сразу начнут грабить. У Яндекса щедрый стартовый грант – вам начислят тысячи рублей на тестирование.
При создании платежного аккаунта попросят ввести данные карты. Это нормально. Средства списываться не будут, пока вы не потратите грант и не превысите лимиты.
Шаг 3. Создание каталога
В консоли Yandex Cloud создайте каталог (folder). Это папка, где будут жить ваши ресурсы. Назовите её, например, «golosovoi_pomoshnik». Запомните идентификатор каталога (folder ID) – он понадобится.
Шаг 4. Создание сервисного аккаунта и получение ключа
Для работы с YandexGPT через API нужно создать сервисный аккаунт и получить для него API-ключ.
Есть два способа аутентификации: IAM-токен (временный) и API-ключ (постоянный). Для конструкторов голосовых помощников удобнее использовать API-ключ.
Как получить API-ключ:
– В консоли Yandex Cloud перейдите в раздел «Сервисные аккаунты».
– Создайте новый сервисный аккаунт.
– Назначьте ему роль ai.languageModels.user (это дает право использовать YandexGPT).
– В меню сервисного аккаунта выберите «Создать API-ключ».
– Скопируйте полученный ключ и сохраните.
Шаг 5. Настройка в конструкторе
В вашей платформе (Aimylogic, Tovie) при выборе YandexGPT вас попросят ввести:
– API-ключ (тот, что создали).
– Идентификатор каталога (folder ID).
– Модель (обычно выбирают yandexgpt-lite для быстрых ответов или yandexgpt для более мощных).
Способ 3. GigaChat: Мозг от Сбера
GigaChat – разработка Сбера. Отличный выбор для бизнеса, который работает в российской юрисдикции и ценит надежность.
Что нужно подготовить:
– Аккаунт Сбер ID (можно завести через приложение Сбербанк Онлайн).
– Паспортные данные (для верификации).
Пошаговая инструкция:
Шаг 1. Вход в SberAI Developer Studio
Зайдите на developers.sber.ru. Нажмите «Войти» и авторизуйтесь через Сбер ID.
Шаг 2. Создание проекта
В личном кабинете нажмите кнопку «Создать проект» в левом меню. Выберите «GigaChat API» в разделе AI-модели.
Шаг 3. Настройка проекта
В открывшемся окне:
– Введите название проекта (например, «Голосовой помощник»).
– Ознакомьтесь и примите условия пользовательского соглашения.
– Обратите внимание на Scope (область доступа). Для физических лиц обычно стоит GIGACHAT_API_PERS.
Шаг 4. Генерация ключа авторизации
В интерфейсе созданного проекта найдите кнопку «Сгенерировать ключ авторизации» (Authorization key). Нажмите её.
Система сгенерирует ключ. Это и есть ваш API-ключ для GigaChat.
Важно: У GigaChat особенная система авторизации. Полученный ключ авторизации нужно обменивать на токен доступа (Access token) при каждом запросе. Но хорошие конструкторы делают это автоматически. Вам нужно просто вставить полученный ключ в соответствующее поле.
Шаг 5. Проверка тарифа
Каждому новому пользователю по умолчанию подключается тариф Freemium. У него есть бесплатные лимиты, которых хватит для тестирования и начального внедрения.
Где использовать в конструкторе:
В настройках интеграции вашего конструктора найдите раздел GigaChat. Вам потребуется ввести:
– API ключ (Authorization key).
– Иногда также запрашивают Scope (GIGACHAT_API_PERS) и базовый URL (обычно https://gigachat.devices.sberbank.ru/api/v1).
Что делать, если что-то пошло не так
Проблема 1: OpenAI не принимает российский телефон
Попробуйте зарегистрироваться через IP адрес европейский или американский. Используйте сервисы виртуальных номеров (например, SMS-activate). Или рассмотрите вариант покупки аккаунта у проверенных поставщиков (но это рискованно с точки зрения безопасности).
Проблема 2: Yandex Cloud просит карту, а вы боитесь её давать
Это нормальный процесс. Яндекс не списывает деньги без вашего ведома. Вы всегда можете установить бюджет и уведомления. На старте вам дадут грант, которого хватит на месяцы тестирования. Карта нужна для идентификации.
Проблема 3: GigaChat выдает ошибки авторизации
Проверьте, правильно ли вы указали ключ. Убедитесь, что в вашем проекте включен доступ к API. Иногда после создания ключа нужно подождать 5—10 минут, пока он активируется.
Сравнение: какую нейросеть выбрать для старта

Резюме для внедрения
– Выберите нейросеть, которая вам ближе. Для 90% российских бизнесов идеально подойдут YandexGPT или GigaChat.
– Пройдите регистрацию по инструкции выше. Это займет 15—20 минут.
– Получите ключ и сохраните его в надежном месте.
– Вставьте ключ в настройки вашего конструктора голосовых помощников.
Теперь у вашего будущего помощника есть МОЗГ. В следующей главе мы подключим ему РОТ и УШИ.
Глава 16. Синтез речи (TTS): Учим помощника говорить красиво (голоса, эмоции, паузы)
Помните нашу вторую главу? Мы говорили о психологии голоса, о том, что 38% успеха коммуникации зависит от интонации. Теперь мы переходим от теории к практике.
Самый страшный сон любого бизнесмена – робот, который говорит как робот. Металлический голос, рваный ритм, отсутствие пауз – это убивает доверие быстрее, чем любые ошибки в логике.
Но есть и хорошая новость: современные технологии синтеза речи (TTS – Text-To-Speech) шагнули так далеко, что грань между человеком и машиной практически стерта. Сегодня мы научимся выбирать голос, настраивать эмоции и делать так, чтобы ваш помощник звучал как лучший сотрудник вашей компании.
Почему голос важнее логики (да, важнее!)
Представьте ситуацию. Клиент звонит в службу поддержки. Робот отвечает безупречно по смыслу: дает точную информацию, правильно отвечает на вопросы. Но голос – монотонный, металлический, безжизненный.
Что почувствует клиент? Дискомфорт. Ему будет казаться, что он разговаривает со стеной. Эмоциональной связи не возникнет. И даже если проблема решена, осадок останется.
А теперь представьте того же робота, но с теплым, живым голосом, с правильными паузами, с легкой улыбкой в интонации. Клиент (подсознательно) воспримет его как «своего». Доверие вырастет в разы.
В TTS есть жестокая правда:
Плохой голос убивает хороший сценарий. Хороший голос спасает посредственный сценарий.
Как устроен современный TTS
Раньше (лет 5—7 назад) синтез речи работал по принципу «склеивания кусочков». Робот произносил слова по слогам, склеивая заранее записанные звуки. Получалось примерно как: «Здрас-твуй-те-ваш-за-каз-го-тов».
Современный TTS – это нейросети. Они обучаются на тысячах часов реальной человеческой речи. Нейросеть не склеивает звуки – она понимает, как должен звучать текст, и генерирует речь с нуля, со всеми интонациями, паузами и эмоциями.
Современный TTS умеет:
– Делать логические паузы (там, где в тексте запятые или точки).
– Изменять интонацию в зависимости от смысла (вопрос, восклицание, утверждение).
– Добавлять «дыхание» (легкий вдох перед фразой – это создает ощущение жизни).
– Произносить сложные слова, аббревиатуры, иностранные имена.
– Передавать эмоции: радость, сочувствие, уверенность.
Где брать голоса: Основные источники
В зависимости от платформы, которую вы выбрали (Aimylogic, Tovie и др.), у вас будут разные варианты голосов.
1. Встроенные голоса платформы
Большинство конструкторов (например, Aimylogic с технологией Aimyvoice) предлагают собственную библиотеку голосов. Это самый простой путь: выбрали голос – и он работает.
Плюсы: Не нужно ничего дополнительно подключать, все настройки внутри платформы.
Минусы: Ограниченный выбор (обычно 5—20 голосов).
2. Сторонние TTS-сервисы (API)
Вы можете подключить профессиональные TTS-движки через API. Самые популярные в России:
– Salute Speech (Сбер): Отличные русские голоса, интеграция с экосистемой Сбера.
– Yandex SpeechKit: Мощный инструмент от Яндекса с огромным выбором голосов и эмоциональных настроек.
– Tinkoff Voice: Тоже достойный вариант с хорошим качеством.
Плюсы: Огромный выбор голосов, тонкие настройки.
Минусы: Нужно получать отдельные ключи и платить дополнительно (часто помегабайтно).
3. Кастомные голоса (Для профи)
Вы можете заказать создание уникального голоса – цифрового двойника реального диктора. Вы записываете диктора в студии (несколько часов речи), нейросеть обучается, и вы получаете голос, который звучит точь-в-точь как ваш сотрудник.
Плюсы: Уникальность, полное соответствие бренду.
Минусы: Дорого (сотни тысяч рублей) и долго.
Для старта я рекомендую использовать встроенные голоса вашей платформы или подключить Yandex SpeechKit – у него отличное соотношение цены и качества.
Как выбрать правильный голос
Выбор голоса – это не вопрос «нравится/не нравится». Это маркетинговая задача. Голос должен соответствовать вашему бренду и ожиданиям клиентов.
Правило 1. Кто ваша целевая аудитория?
– Если вы продаете дорогие услуги (юристы, банки, консалтинг) – выбирайте уверенный, солидный мужской голос средних лет. Он вызывает доверие и ощущение компетентности.
– Если у вас сфера красоты, здоровья, ухода – лучше подойдет теплый, заботливый женский голос. Он ассоциируется с заботой и вниманием.
– Если ваш продукт для молодежи (доставка еды, развлечения) – можно выбрать энергичный, живой голос, возможно, с более быстрым темпом.
– Если вы работаете с пожилыми людьми – голос должен быть медленным, четким, с низким тембром (никакой визгливости).
Правило 2. Тестируйте на реальных людях
Не выбирайте голос в одиночку. Дайте послушать 2—3 варианта вашим сотрудникам, друзьям, знакомым клиентам. Спросите: «Какой голос вызывает больше доверия? С кем бы вы хотели поговорить?».
Правило 3. Избегайте «зловещей долины»
Есть такое понятие в робототехнике. Когда робот слишком похож на человека, но чуть-чуть не дотягивает, он вызывает отвращение (зловещую долину). С голосом то же самое.
Если голос звучит почти как человеческий, но с легким металлическим оттенком, это может раздражать. Иногда честный «роботизированный» голос (но приятный) воспринимается лучше, чем неудачная попытка косить под человека. Экспериментируйте.
Настройка эмоций: Делаем голос живым
Современные TTS позволяют управлять не только текстом, но и эмоциональной окраской.
Вариант 1. SSML-разметка (продвинутый уровень)
SSML – это специальный язык разметки, который вставляется прямо в текст и управляет произношением. Выглядит это так:
html
Здравствуйте!
Ваш заказ уже собран и передан в доставку.
Хорошего дня!
Что здесь происходит:
–
–
SSML позволяет управлять:
– Ударениями в сложных словах.
– Скоростью речи отдельных фраз.
– Высотой тона.
– Паузами разной длины.
Вариант 2. Эмоциональные пресеты (простой уровень)
Многие платформы (например, Yandex SpeechKit) предлагают готовые эмоциональные настройки: «радость», «сочувствие», «уверенность», «нейтрально». Вы просто выбираете нужный пресет для всего диалога или для его части.






