
Полная версия
Искусственный интеллект от А до Б
Неудивительно, что LLM хороши в написании текстов, учитывая, что они обучены доработке текста. Чтобы изучить влияние ChatGPT на письмо, в исследовании MIT (Noy and Zhang, 2023) 453 специалиста с высшим образованием были назначены письменные задания по конкретным профессиям, и половина из них случайным образом подверглась воздействию ChatGPT. Их результаты показывают, что среди тех, кто использовал ChatGPT, среднее затрачиваемое время сократилось на 40%, а качество вывода выросло на 18%. ChatGPT помогает сократить разрыв в качестве вывода между сотрудниками, а это означает, что он более полезен для тех, у кого меньше склонности к письму. Работники, подвергшиеся воздействию ChatGPT во время эксперимента, в 2 раза чаще сообщали об использовании его на своей реальной работе через две недели после эксперимента и в 1,6 раза чаще через два месяца после этого.
Для потребителей варианты использования очевидны. Многие используют искусственный интеллект, чтобы улучшить общение. Вы можете разозлиться в электронном письме и попросить ИИ сделать его приятным. Вы можете поставить ему маркированные точки и получить обратно полные абзацы. Несколько человек заявили, что больше не отправляют важные электронные письма, не попросив ИИ сначала улучшить его.
Студенты используют искусственный интеллект для написания эссе. Писатели используют искусственный интеллект для написания книг. Многие стартапы уже используют ИИ для создания детских, фанфиков, романтических и фэнтезийных книг. В отличие от традиционных книг, книги, созданные искусственным интеллектом, могут быть интерактивными, так как сюжет книги может меняться в зависимости от предпочтений читателя. Это означает, что читатели могут активно участвовать в создании истории, которую они читают. Приложение для детского чтения определяет слова, с которыми у ребенка возникают проблемы, и создает истории, сосредоточенные вокруг этих слов.
Приложения для создания заметок и электронной почты, такие как Google Docs или Notion, используют искусственный интеллект, чтобы помочь пользователям улучшить свое письмо. Grammarly, приложение-помощник по письму, настраивает модель, чтобы сделать письмо пользователей более плавным, связным и ясным.
Способностью ИИ к письму также можно злоупотреблять. В 2023 году New York Times сообщила, что Amazon наводнен дрянными путеводителями, созданными искусственным интеллектом, каждый из которых снабжен биографией автора, веб-сайтом и восторженными отзывами, созданными искусственным интеллектом.
Для предприятий написание текстов на основе ИИ широко распространено в продажах, маркетинге и общении в команде. Многие менеджеры рассказали мне, что они используют искусственный интеллект для написания отчетов о производительности. ИИ может помочь в создании эффективных электронных писем для холодной аутрич-рассылки, копирайтинга объявлений и описаний продуктов. Приложения для управления взаимоотношениями с клиентами (CRM), такие как HubSpot и Salesforce, также имеют инструменты для корпоративных пользователей для создания веб-контента и электронных писем.
ИИ кажется особенно хорошим в SEO, возможно, потому что многие модели ИИ обучаются на данных из Интернета, которые заполняются SEO-оптимизированным текстом. ИИ настолько хорош в SEO, что он позволил создать новое поколение контент-ферм. Эти фермы создают мусорные веб-сайты и наполняют их контентом, созданным искусственным интеллектом, чтобы они занимали высокие позиции в Google и привлекали на них трафик. Затем они продают рекламные места через рекламные биржи. В июне 2023 года NewsGuard обнаружил почти 400 объявлений от 141 популярного бренда на мусорных веб-сайтах, созданных искусственным интеллектом. Один из этих мусорных сайтов выпускал 1200 статей в день. Если не будет предпринято что-то, чтобы ограничить это, будущее интернет-контента будет создано искусственным интеллектом, и оно будет довольно мрачным.
Всякий раз, когда ChatGPT не работает, сервер OpenAI в Discord наводнен студентами, жалующимися на то, что они не могут выполнить домашнее задание. Несколько учебных заведений поспешили запретить ChatGPT, опасаясь, что ученики будут использовать его для списывания, но всего через несколько месяцев отменили свои решения.
Вместо того, чтобы запрещать ИИ, школы могли бы внедрить его, чтобы помочь учащимся учиться быстрее. ИИ может обобщать учебники и создавать персонализированные планы лекций для каждого студента. Странно, что реклама персонализирована, потому что мы знаем, что все люди разные, а образование – нет. ИИ может помочь адаптировать материалы к формату, наиболее подходящему для каждого студента. Аудиалы могут попросить ИИ прочитать материалы вслух. Учащиеся, которые любят животных, могут использовать искусственный интеллект для адаптации визуализаций, чтобы показать больше животных. Те, кому легче читать код, чем математические уравнения, могут попросить ИИ перевести математические уравнения в код.
ИИ особенно полезен для изучения языка, так как вы можете попросить его разыграть различные сценарии практики. Паяк и Бикнелл (Duolingo, 2022) обнаружили, что из четырех этапов создания курса персонализация уроков – это этап, который может извлечь наибольшую пользу из ИИ.
ИИ может генерировать тесты, как с несколькими вариантами ответов, так и с открытым выбором, и оценивать ответы. ИИ может стать партнером по дебатам, поскольку он гораздо лучше представляет различные точки зрения на одну и ту же тему, чем среднестатистический человек. Например, Академия Хана предлагает студентам ассистентов преподавателей на основе искусственного интеллекта, а преподавателям – ассистентов по курсам. Инновационный метод обучения заключается в том, что учителя назначают студентам эссе, созданные искусственным интеллектом, чтобы найти и исправить ошибки.
В то время как многие образовательные компании используют ИИ для создания более качественных продуктов, многие из них обнаруживают, что их обеды отнимает ИИ. Например, цена акций Chegg, компании, которая помогает студентам с домашним заданием, упала с 28 долларов при запуске ChatGPT в ноябре 2022 года до 2 долларов в сентябре 2024 года, поскольку студенты обратились за помощью к искусственному интеллекту. Если риск заключается в том, что ИИ может заменить многие навыки, то возможность заключается в том, что ИИ можно использовать в качестве репетитора для обучения любому навыку. Для многих навыков ИИ может помочь кому-то быстро освоиться, а затем продолжить обучение самостоятельно, чтобы стать лучше ИИ.
Разговорные боты универсальны. Они могут помочь нам найти информацию, объяснить концепции и провести мозговой штурм идей. ИИ может стать вашим спутником и терапевтом. Он может имитировать личности, позволяя вам разговаривать с цифровой копией кого угодно, кто вам нравится. Цифровые подруги и бойфренды стали странно популярными за невероятно короткий промежуток времени. Многие уже тратят больше времени на общение с ботами, чем с людьми (см. обсуждения здесь и здесь). Некоторые беспокоятся, что ИИ испортит знакомства. В ходе исследований люди также обнаружили, что они могут использовать группу разговорных ботов для моделирования общества, что позволяет им проводить исследования социальной динамики.
Для предприятий наиболее популярными ботами являются боты службы поддержки клиентов. Они могут помочь компаниям сократить расходы и улучшить качество обслуживания клиентов, поскольку они могут отвечать пользователям быстрее, чем операторы. ИИ также может быть помощником пилота продукта, который помогает клиентам выполнять болезненные и запутанные задачи, такие как подача страховых претензий, уплата налогов или поиск корпоративных полисов.
Успех ChatGPT вызвал волну текстовых разговорных ботов. Однако текст – не единственный интерфейс для разговорных операторов. Голосовые помощники, такие как Google Assistant, Siri и Alexa, существуют уже много лет. 3D-боты уже распространены в играх и набирают обороты в розничной торговле и маркетинге.
Одним из вариантов использования 3D-персонажей на основе искусственного интеллекта являются умные NPC, неигровые персонажи (см. демонстрации NVIDIA для Inworld и Convai). NPC необходимы для продвижения сюжетной линии многих игр. Без ИИ NPC обычно заскриптованы на выполнение простых действий с ограниченным набором диалогов. ИИ может сделать этих NPC намного умнее. Интеллектуальные боты могут изменить динамику существующих игр, таких как The Sims и Skyrim, а также сделать возможными новые игры.
Многие люди считают, что наш успех зависит от нашего умения фильтровать и усваивать полезную информацию. Однако следить за электронной почтой, сообщениями в Slack и новостями иногда бывает непросто. К счастью, на помощь пришел искусственный интеллект. ИИ доказал свою способность агрегировать информацию и обобщать ее. Согласно исследованию Salesforce Generative AI Snapshot Research за 2023 год, 74% пользователей генеративного ИИ используют его для выделения сложных идей и обобщения информации.
Для потребителей многие приложения могут обрабатывать ваши документы – контракты, раскрытия информации, бумаги – и позволяют вам извлекать информацию в разговорной манере. Этот вариант использования также называется «поговорите со своими документами». ИИ может помочь вам обобщить веб-сайты, провести исследования и создать отчеты по выбранным вами темам.
Агрегация и дистилляция информации имеют важное значение для работы предприятия. Более эффективная агрегация и диссимиляция информации может помочь организации стать более компактной, так как это снижает нагрузку на руководителей среднего звена. Когда Instacart запустил внутреннюю торговую площадку подсказок, она обнаружила, что одним из самых популярных шаблонов подсказок является «Быстрая разбивка». В этом шаблоне ИИ предлагается обобщить заметки о встречах, электронные письма и беседы в Slack с фактами, открытыми вопросами и действиями. Эти действия затем могут быть автоматически вставлены в инструмент отслеживания проекта и назначены правым владельцам. Искусственный интеллект может помочь вам получить критически важную информацию о ваших потенциальных клиентах и провести анализ ваших конкурентов. Чем больше информации вы соберете, тем важнее ее систематизировать. Агрегация информации идет рука об руку с организацией данных.
Одно можно сказать наверняка: в будущем мы будем продолжать производить все больше и больше данных. Пользователи смартфонов продолжат снимать фото и видео. Компании продолжат регистрировать все о своих продуктах, сотрудниках и клиентах. Каждый год заключаются миллиарды контрактов. Фотографии, видео, журналы и PDF-файлы – это неструктурированные или полуструктурированные данные. Очень важно организовать все эти данные таким образом, чтобы их можно было найти позже. ИИ может помочь именно в этом. ИИ может автоматически создавать текстовые описания изображений и видео или сопоставлять текстовые запросы с визуальными элементами, которые соответствуют этим запросам. Такие сервисы, как Google Photos, уже используют искусственный интеллект для отображения изображений, соответствующих поисковым запросам. Google Image Search идет еще дальше: если нет изображений, соответствующих потребностям пользователей, он может их сгенерировать. ИИ очень хорошо справляется с анализом данных. Он может писать программы для визуализации данных, выявления выбросов и составления прогнозов, таких как прогнозы доходов.
Предприятия могут использовать искусственный интеллект для извлечения структурированной информации из неструктурированных данных, которые могут быть использованы для организации данных и их поиска. Простые варианты использования включают автоматическое извлечение информации из кредитных карт, водительских прав, квитанций, билетов, контактной информации из нижних колонтитулов электронной почты и так далее. Более сложные сценарии использования включают извлечение данных из контрактов, отчетов, диаграмм и т. д. По оценкам, к 2030 году индустрия IDP, интеллектуальной обработки данных, достигнет $12,81 млрд, увеличиваясь на 32,9% каждый год.
В конечном счете, ИИ должен автоматизировать как можно больше. Конечным пользователям автоматизация может помочь в решении скучных повседневных задач, таких как бронирование ресторанов, запрос возврата, планирование поездок и заполнение форм. Для предприятий ИИ может автоматизировать повторяющиеся задачи, такие как управление лидами, выставление счетов, возмещение расходов, управление запросами клиентов, ввод данных и так далее. Одним из особенно интересных вариантов использования является использование моделей ИИ для синтеза данных, которые затем могут быть использованы для улучшения самих моделей. Вы можете использовать искусственный интеллект для создания меток для ваших данных, зацикливая людей для улучшения меток. Доступ к внешним инструментам необходим для выполнения многих задач. Чтобы забронировать ресторан, приложению может потребоваться разрешение на открытие поисковой системы для поиска номера ресторана, использование телефона для совершения звонков и добавление встреч в календарь. ИИ, которые могут планировать и использовать инструменты, называются агентами. Уровень интереса к агентам граничит с одержимостью, но он не совсем необоснованный. Агенты ИИ могут сделать каждого человека значительно более продуктивным и принести гораздо больше экономической ценности.
Учитывая, казалось бы, безграничный потенциал искусственного интеллекта, заманчиво заняться созданием приложений. Если вы просто хотите учиться и получать удовольствие, приступайте к работе. Однако, если вы зарабатываете этим на жизнь, возможно, стоит сделать шаг назад и подумать. С помощью базовых моделей легко создать крутую демонстрацию. Сложно создать прибыльный продукт.
Первый вопрос, который следует задать, – зачем вы хотите создать это приложение. Как и многие бизнес-решения, создание приложения ИИ часто является ответом на риски и возможности. Вот несколько примеров различных уровней рисков, упорядоченных от высокого к низкому:
1. Если вы этого не сделаете, конкуренты с искусственным интеллектом могут сделать вас устаревшим. Если ИИ представляет собой серьезную экзистенциальную угрозу для вашего бизнеса, внедрение ИИ должно иметь наивысший приоритет. В исследовании Gartner за 2023 год 7% назвали непрерывность бизнеса причиной внедрения ИИ. Это более характерно для предприятий, занимающихся обработкой документов и агрегацией информации, таких как финансовый анализ, страхование и обработка данных. Это также характерно для творческих работ, таких как реклама, веб-дизайн и производство изображений.
2. Если вы этого не сделаете, вы упустите возможности для увеличения прибыли и производительности. Большинство компаний используют ИИ из-за возможностей, которые он предоставляет. ИИ может помочь в большинстве, если не во всех, бизнес-операциях. ИИ может сделать привлечение пользователей дешевле за счет создания более эффективных копирайтеров, описаний продуктов и рекламного визуального контента. ИИ может повысить удержание пользователей за счет улучшения поддержки клиентов и настройки пользовательского опыта. ИИ также может помочь в генерации лидов в продажах, внутренней коммуникации, исследовании рынка и отслеживании конкурентов.
3. Вы еще не уверены, какое место ИИ займет в вашем бизнесе, но не хотите отставать. В то время как компания не должна гнаться за каждым поездом хайпа, многие потерпели неудачу, слишком долго ожидая, чтобы сделать прыжок (как, например, Kodak). Инвестирование ресурсов в понимание того, как новая, трансформационная технология может повлиять на ваш бизнес, – неплохая идея, если вы можете себе это позволить. В крупных компаниях это может быть частью отдела исследований и разработок.
Как только вы найдете вескую причину для разработки этого варианта использования, вы можете подумать, нужно ли вам создавать его самостоятельно. Если ИИ представляет собой экзистенциальную угрозу для вашего бизнеса, вы, возможно, захотите заняться ИИ самостоятельно, а не передавать его на аутсорсинг конкурентам.
Однако, если вы используете искусственный интеллект для увеличения прибыли и производительности, у вас может быть множество вариантов покупки, которые могут сэкономить ваше время и деньги, обеспечивая при этом лучшую производительность. То, какую роль ИИ играет в продукте ИИ, влияет на разработку приложения и его требования. У Apple есть отличный документ, объясняющий различные способы использования ИИ в продукте.
Если приложение все еще может работать без ИИ, ИИ дополняет приложение. Например, Face ID не будет работать без распознавания лиц на основе искусственного интеллекта, в то время как Gmail все равно будет работать без Smart Compose. Чем более критичен ИИ для приложения, тем более точной и надежной должна быть часть ИИ. Люди более терпимы к ошибкам, когда ИИ не является ядром приложения.
Реактивная функция показывает свои ответы в ответ на запросы или конкретные действия пользователей, в то время как проактивная функция показывает свои ответы, когда для этого есть возможность. Например, чат-бот является реактивным, в то время как предупреждения о дорожном движении на Google Картах являются проактивными.
Поскольку реактивные функции создаются в ответ на события, они обычно, но не всегда, должны происходить быстро. С другой стороны, упреждающие функции могут быть предварительно вычислены и отображены в удобном виде, поэтому задержка менее важна.
Поскольку пользователи не просят об упреждающих функциях, они могут рассматривать их как навязчивые или раздражающие, если качество низкое. Таким образом, упреждающие прогнозы и поколения обычно имеют более высокую шкалу качества.
Динамические функции постоянно обновляются с учетом отзывов пользователей, в то время как статические функции обновляются периодически. Например, Face ID необходимо обновлять по мере изменения лиц людей с течением времени. Однако обнаружение объектов в Google Фото, скорее всего, обновляется только при обновлении Google Фото.
В случае с искусственным интеллектом динамические функции могут означать, что у каждого пользователя есть своя собственная модель, постоянно настраиваемая на основе его данных, или другие механизмы персонализации, такие как функция памяти ChatGPT, которая позволяет ChatGPT запоминать предпочтения каждого пользователя. Однако статические функции могут иметь одну модель для группы пользователей. В этом случае эти функции обновляются только при обновлении общей модели.
Также важно уточнить роль человека в приложении. Будет ли ИИ оказывать фоновую поддержку людям, принимать решения напрямую или и то, и другое? Например, для чат-бота службы поддержки ИИ ответы могут использоваться по-разному: ИИ показывает несколько ответов, на которые операторы могут ссылаться для написания более быстрых ответов; ИИ реагирует только на простые запросы и направляет более сложные запросы людям; ИИ отвечает на все запросы напрямую, без участия человека.
Вовлечение людей в процессы принятия решений ИИ называется «человек в контуре». Microsoft (2023) предложила фреймворк для постепенного увеличения автоматизации ИИ в продуктах, которые они называют Crawl-Walk-Run: crawl означает, что участие человека является обязательным; walk означает, что ИИ может напрямую взаимодействовать с внутренними сотрудниками; run означает повышенную автоматизацию, потенциально включающую прямое взаимодействие ИИ с внешними пользователями.
Роль человека может меняться со временем по мере улучшения качества системы искусственного интеллекта. Например, в самом начале, когда вы все еще оцениваете возможности ИИ, вы можете использовать его для создания предложений для агентов-людей. Если уровень принятия агентами-людьми высок, например, 95% ответов на простые запросы, предложенных ИИ на простые запросы, используются агентами-людьми дословно, вы можете позволить клиентам напрямую взаимодействовать с ИИ для этих простых запросов.
Если вы продаете приложения ИИ как отдельные продукты, важно учитывать их защиту. Низкий входной барьер – это одновременно и благословение, и проклятие. Если вам легко построить, то и вашим конкурентам тоже легко. Какие рвы у вас есть для защиты вашего продукта?
В некотором смысле, создание приложений на основе моделей фундамента означает создание слоя поверх этих моделей. Это также означает, что, если базовые модели расширяют свои возможности, предоставленный вами слой может быть поглощен моделями, что сделает ваше приложение устаревшим. Представьте себе создание приложения для разбора PDF-файлов на основе ChatGPT, основанного на предположении, что ChatGPT не может хорошо анализировать PDF-файлы или не может делать это в масштабе. Ваша способность конкурировать ослабнет, если это предположение больше не будет верным. Тем не менее, даже в этом случае приложение для анализа PDF-файлов может иметь смысл, если оно построено на основе моделей с открытым исходным кодом, ориентируя ваше решение на пользователей, которые хотят размещать модели внутри компании.
В ИИ обычно есть три типа конкурентных преимуществ: технологии, данные и распространение – способность представить свой продукт пользователям. При использовании базовых моделей основные технологии большинства компаний будут схожими. Преимущество в распространении, скорее всего, принадлежит крупным компаниям.
Преимущество данных имеет больше нюансов. Крупные компании, вероятно, имеют больше существующих данных. Однако, если стартап сможет первым выйти на рынок и собрать достаточно данных об использовании для постоянного улучшения своих продуктов, данные станут для него рвом. Даже в тех сценариях, где пользовательские данные не могут быть использованы для непосредственного обучения моделей, информация об использовании может дать бесценную информацию о поведении пользователей и недостатках продукта, которую можно использовать для руководства процессом сбора данных и обучения.
Было много успешных компаний, чьи оригинальные продукты могли бы быть особенностями более крупных продуктов. Календарь мог бы быть функцией Google Календаря. Mailchimp мог бы быть функцией Gmail. Фотокомната могла бы быть функцией Google Фото. Многие стартапы в конечном итоге обгоняют более крупных конкурентов, начиная с создания функции, которую эти более крупные конкуренты упустили из виду. Возможно, ваш может стать следующим.
Как только вы решили, что вам нужно создать это удивительное приложение с искусственным интеллектом самостоятельно, следующим шагом будет выяснение того, как выглядит успех: как вы будете измерять успех? Самый важный показатель – как это повлияет на ваш бизнес. Например, если это чат-бот службы поддержки клиентов, бизнес-метрики могут включать следующее: какой процент сообщений клиентов вы хотите, чтобы чат-бот автоматизировал? сколько еще сообщений должен разрешить обработать чат-бот? насколько быстрее вы можете ответить с помощью чат-бота? сколько человеческого труда может сэкономить вам чат-бот?
Чат-бот может ответить на большее количество сообщений, но это не значит, что он сделает пользователей счастливыми, поэтому важно отслеживать удовлетворенность клиентов и отзывы клиентов в целом. Чтобы гарантировать, что продукт не будет представлен клиентам до того, как он будет готов, имейте четкие ожидания относительно порога его полезности: насколько хорошим он должен быть, чтобы быть полезным. Пороговые значения полезности могут включать следующие группы метрик. В частности, метрики качества для измерения качества ответов чат-бота. Метрики задержки, включая TTFT (время до первого токена), TPOT (время на выходной токен) и общую задержку. То, что считается допустимой задержкой, зависит от вашего сценария использования. Если все запросы ваших клиентов в настоящее время обрабатываются людьми со средним временем ответа в час, может быть достаточно чего-то более быстрого. Метрики стоимости: сколько стоит один запрос на вывод. Другие метрики, такие как интерпретируемость и справедливость. Если вы еще не уверены, какие метрики хотите использовать, не волнуйтесь. Остальная часть книги будет посвящена многим из этих показателей.
После того, как вы поставили измеримые цели, вам нужен план для их достижения. Как добраться до целей, зависит от того, с чего вы начнете. Оцените существующие модели, чтобы понять их возможности. Чем прочнее готовые модели, тем меньше работы вам придется выполнять. Например, если ваша цель состоит в том, чтобы автоматизировать 60% тикетов клиентской поддержки, а готовая модель, которую вы хотите использовать, уже может автоматизировать 30% тикетов, то усилия, которые вам нужно приложить, могут быть меньше, чем если бы она вообще не могла автоматизировать тикеты.
Вполне вероятно, что ваши цели изменятся после оценки. Например, после оценки вы можете понять, что ресурсы, необходимые для того, чтобы довести приложение до порога полезности, будут больше, чем его потенциальная отдача, и, следовательно, вы больше не хотите заниматься этим проектом.