Полная версия
Искусственный интеллект на практике
Бернард Марр, Мэтт Уорд
Искусственный интеллект на практике
50 кейсов успешных компаний
Издано с разрешения
John Wiley & Sons Limited (a company of John Wiley & Sons, Inc.)
Все права защищены.
Никакая часть данной книги не может быть воспроизведена в какой бы то ни было форме без письменного разрешения владельцев авторских прав.
© 2019 Bernard Marr All Rights Reserved. Authorised translation from the English language edition published by John Wiley & Sons Limited. Responsibility for the accuracy of the translation rests solely with Mann, Ivanov and Ferber and is not the responsibility of John Wiley & Sons Limited. No part of this book may be reproduced in any form without the written permission of the original copyright holder, John Wiley & Sons Limited.
© Перевод на русский язык, издание на русском языке, оформление. ООО «Манн, Иванов и Фербер», 2020
* * *Предисловие
Искусственный интеллект (ИИ) бесповоротно меняет мир. И перемены глубже, чем кажется сейчас. В будущем ИИ затронет или полностью преобразует все профессии во всех сферах.
ИИ наделяет машины способностью видеть, слышать, ощущать вкус и запах, осязать, говорить, ходить, летать и учиться. Благодаря этому компании могут найти новые способы общения с клиентами, предлагать более интеллектуальные продукты и услуги, автоматизировать процессы и добиваться небывалых успехов.
Вокруг ИИ много шумихи, но не все понимают, что это такое. Одни видят в нем угрозу цивилизации, а другие – решение всех проблем человечества, от глобального потепления до исцеления рака. Мы хотим рассказать о роли ИИ в современном бизнесе – без ажиотажа и нагнетания паники.
Мы приведем реальные примеры инновационного использования ИИ в разных сферах. Так мы надеемся развеять мифы и показать, что его возможности безграничны. Технических подробностей в книге – минимум, поэтому она будет понятна большинству читателей.
Чтобы сделать книгу информативной для профессионалов, кое-какие технические детали мы все же сохранили.
Вы узнаете, как работают с ИИ стартапы, традиционные компании и гиганты вроде Google, Facebook, Alibaba, Baidu, Microsoft, Amazon и Tencent. Мы описываем ситуацию реалистично: первопроходцы ИИ несутся вперед на всех парах, оставляя позади традиционные компании, которые изо всех сил пытаются сохранить конкурентоспособность. А стартапы тем временем ставят подножку то одним, то другим.
Мощнейшая технология человечестваИИ – самая могущественная из современных технологий, и игнорировать ее – ошибка. Лидеры стран и компаний видят в ней колоссальные возможности и боятся остаться позади всех в гонке за ИИ.
Белый дом выпустил в США не один документ о стратегической важности ИИ. В 2016 году, при Бараке Обаме, вышел первый доклад «Подготовка к будущему с искусственным интеллектом»[1], заложивший основу американской стратегии в этом направлении. В 2018 году, уже при Дональде Трампе, после саммита по ИИ в Белом доме администрация обнародовала инициативу «Искусственный интеллект для американского народа»[2]. Президент США заявил: «Мы стоим на пороге новой технологической революции, которая может улучшить все аспекты нашей жизни, обогатить американских трудящихся и их семьи и покорить новые высоты в науке, медицине и коммуникациях». Администрация США намерена сохранить лидерство страны в области ИИ, стимулировать его исследования и внедрение, а также обучать американцев использовать все его преимущества[3].
Президент России Владимир Путин высказался так: «Искусственный интеллект – это будущее, и не только России, но всего человечества. […] Тот, кто станет лидером в этой сфере, будет править миром»[4]. Самые амбициозные планы у правительства Китая – к 2030 году выйти в сфере ИИ на первое место[5]. Еврокомиссия в 2018 году опубликовала стратегию ИИ, где говорится: «Как в свое время паровые двигатели и электричество, ИИ меняет мир, общество и промышленность. Вследствие роста вычислительной мощности, доступности данных и прогресса в алгоритмах ИИ стал стратегической технологией XXI века. Серьезность ситуации невозможно переоценить. От решений в сфере ИИ зависит, в каком мире мы будем жить»[6].
Бизнес-лидеры с этим согласны. Генеральный директор Amazon Джефф Безос уверен, что мы вступили в «золотой век» ИИ и способны решать задачи, которые прежде относились к области фантастики[7]. Сооснователь Google Сергей Брин уверяет: «Новый скачок в развитии ИИ – самое значительное событие в компьютерной области за всю мою жизнь»[8]. По словам генерального директора Microsoft Сатьи Наделлы, ИИ это «определяющая технология нашего времени»[9]. Учредитель и исполнительный председатель Мирового экономического форума Клаус Шваб, как и многие другие, считает ИИ (особенно в сочетании с другими технологическими инновациями) двигателем четвертой индустриальной революции, которая ведет к изменениям во всех аспектах бизнеса и общества[10].
Что такое ИИ и расцвет глубокого машинного обученияИИ – не новость и не сказка. Первые разработки в этой сфере начались еще в 1950-х. ИИ – это способность компьютерных систем или машин вести себя подобно разумным существам, учиться и самостоятельно действовать. ИИ берет данные, применяет к ним вычислительные правила (алгоритмы) и на основании расчетов принимает решение или прогнозирует результат.
Данными могут быть изображения с рукописным текстом, буквы и цифры. Алгоритм – это написанная человеком компьютерная программа с некими правилами: например, каким должен быть шрифт или интервал между словами. Программа анализирует отсканированный текст, применяет правила и прогнозирует, какие буквы, цифры и слова в нем содержатся. Так машина распознает рукописный текст. Подобный ИИ еще с 1997 года использовала почта США, чтобы автоматически считывать адреса на конвертах. Для узкой задачи этот ИИ вполне годился.
ИИ на основе правил не справляется с более сложными задачами. Не подходит он и в случаях, когда правила трудно сформулировать, а значит невозможно внести в программу. Мы говорим на родном языке, ходим, узнаем лица друзей в толпе незнакомцев – и всему этому учимся по опыту, а не по правилам.
Нейронные сети мозга тренируются распознавать лица, когда мы наблюдаем их в разных ракурсах некоторое время. Движение и речь развиваются в ходе проб и ошибок. В современном ИИ за обучение отвечают искусственные нейронные сети. Мы не программируем правила – машины создают их сами. Происходит это в процессе, аналогичном нашему познанию на опыте. Это и называется «машинное обучение».
В машинном обучении ИИ обрабатывает данные тысяч изображений, с человеческим лицом или без него. Он создает свой алгоритм либо полностью самостоятельно (машинное обучение без учителя), либо с помощью человека (машинное обучение с учителем).
Если обучающие данные обрабатываются несколькими слоями искусственных нейронных сетей, – это глубокое обучение. Именно благодаря ему произошел рывок в развитии ИИ, в том числе компьютер смог распознавать, что или кого он видит на изображении или видео (машинное зрение). А еще ИИ стал лучше понимать рукописный текст и устную речь, писать и говорить. Эта технология называется обработкой естественного языка – ее мы наблюдаем на примере чат-ботов и умных колонок Amazon Echo.
Машинное обучение успешно по двум причинам.
1. Наличие данных. Данные – это сырье для ИИ, а в нынешнем мире больших данных их производится больше, чем когда-либо. Происходит цифровизация: любая деятельность оставляет цифровой след. Вокруг нас все больше устройств, которые собирают и передают данные. Данных для обучения ИИ тоже становится больше, а их многообразие растет крайне быстро.
2. Вычислительная мощность. Прорыв в облачных вычислениях позволяет хранить практически неограниченные объемы данных – и при этом дешево. А с помощью распределенных вычислений они анализируются почти в реальном времени. Микроэлектронные технологии прогрессируют, поэтому сложные вычисления возможны на маленьких мобильных устройствах, например на смартфонах. Мы называем это граничными (или периферийными) вычислениями на устройствах интернета вещей.
Люди непрерывно учатся и совершенствуются на своем опыте. Это обучение действием. В алгоритмах машинного обучения ему соответствует обучение с подкреплением. Ребенок учится ходить, все время делая поправку на опыт: если он упал из-за того, что широко шагнул, – значит, надо сделать шаг поменьше.
ИИ, который действует по алгоритму обучения с подкреплением, выбирает оптимальное поведение точно так же: он исходит из реакции среды. С подкреплением машины, например роботы, учатся ходить, управлять автомобилем и летать. В большинстве передовых программ сочетаются методы подкрепления и глубокого обучения.
Подробнее об этом – по ссылке www.bernardmarr.com. Там найдутся сотни статей и видео, где объясняется и обсуждается все связанное с ИИ и машинным обучением.
ИИ для бизнесаЕсть три основные модели внедрения ИИ в бизнес, и в некоторой степени они пересекаются. Компании используют ИИ, чтобы: 1) по-новому собирать информацию о клиентах и взаимодействовать с ними; 2) предлагать более интеллектуальные продукты и услуги; 3) совершенствовать и автоматизировать бизнес-процессы.
Клиенты. С помощью ИИ компании глубже понимают своих клиентов, лучше представляют, какие продукты и услуги их заинтересуют, находят к каждому индивидуальный подход и прогнозируют рыночный спрос и тренды. В книге мы рассмотрим примеры Facebook, Stitch Fix и других компаний, которым ИИ помогает собирать информацию о клиентах.
Продукты и услуги. С ИИ компании могут предложить клиентам более интеллектуальные продукты и услуги. Клиенты хотят получить умные телефоны, умные машины и умные дома. Вы узнаете, как Apple, Samsung, Tesla и Volvo создают подобные продукты, а Spotify, Disney, Uber и другие – услуги.
Автоматизация процессов. ИИ может улучшить бизнес-процессы и помочь их автоматизировать. На примере JD.com мы расскажем, как автономные дроны, автоматизированные центры обработки заказов и роботы-курьеры влияют на коммерческую деятельность компании. Еще мы коснемся автоматизации медицинской диагностики в Infervision и Elsevier и проверки качества пиццы в Domino’s.
Стратегическое использование ИИ в бизнесеКогда внедряется ИИ, в компании обычно пересматриваются бизнес-модели, а иногда полностью трансформируется и весь подход к бизнесу. Важно: не получится автоматизировать и усовершенствовать с помощью ИИ бизнес-модели, которые морально устарели за время четвертой индустриальной революции.
Внедрять ИИ нужно со стратегии и данных. Также надо определить важнейшие стратегические возможности и угрозы и составить список максимально эффективных вариантов использования ИИ. Эксперименты без четких планов не сработают.
ИИ в действииМы рассмотрим 50 примеров того, как использовать ИИ, чтобы решить практические задачи в бизнесе. В книге – пять частей.
В первой рассказывается об опыте первопроходцев ИИ – технологических компаниях, которые ухватились за его возможности, ринулись навстречу переменам и получили завидные результаты. Многие сделали инновации в сфере ИИ частью бизнеса. Их пример показывает, чего реально можно достигнуть.
Изначально мы колебались, как распределить остальные примеры – по типу применения или по профилю компании, – и все-таки выбрали второй вариант.
Во второй части рассматривается опыт ритейла – розничной торговли, а также производителей потребительских товаров, продуктов питания и напитков. Из третьей части вы узнаете, как применяют ИИ в медиа, развлекательных и телекоммуникационных компаниях. Четвертая часть посвящена сектору услуг, в том числе финансовых, и здравоохранению. В пятой, заключительной части мы расскажем о промышленных, автомобильных, аэрокосмических компаниях и четвертой промышленной революции.
Читайте все подряд или выбирайте актуальные для вас примеры и темы. Надеемся, будет интересно!
Часть 1. Первопроходцы искусственного интеллекта
1. Alibaba. ИИ стимулирует ритейл и продажи в В2В
Международная китайская группа компаний Alibaba Group владеет крупнейшей в мире торговой сетью порталов в онлайне. В нее входят Alibaba.com, Taobao, Tmall и Ali Express. По объему продаж они оставили далеко позади Amazon и eBay вместе взятые[11]. Опыт создания международного интернет-магазина компания реализовала в проектах во всех сферах бизнеса и технологий. Онлайн-продажи, обслуживание розничных торговцев, электронные платежи и облачные сервисы В2В принесли Alibaba доход более 500 млрд долларов.
В поиске товаров используются инструменты ИИ. Как крупнейший провайдер облачных вычислений, Alibaba лицензирует платформы, инструменты и облачные сервисы, помогая осваивать ИИ другим компаниям.
Alibaba использует ИИ и для общественно значимых проектов: разрабатывает «умные города». Компания планирует радикально реформировать сельскохозяйственную промышленность Китая (а возможно и других стран), чтобы обеспечить продовольствием растущее население.
Как Alibaba использует ИИКитайское правительство активно поддерживает внедрение ИИ в компаниях, поскольку видит в нем огромный потенциал экономического роста. Цель правительства – довести стоимость промышленности до 1 трлн долларов и к 2030 году выйти в мировые лидеры в сфере ИИ[12].
Плюс у компаний есть доступ к данным огромного числа граждан, что благоприятствует развитию ИИ.
Коммерческие порталы Alibaba для отбора товаров, которые предлагаются пользователю при посещении сайта и в результатах поиска, используют ИИ высокой сложности. Он кастомизирует страницу для конкретного пользователя и показывает ему товары, которые предположительно того заинтересуют, причем учитывает ценовой диапазон.
Отслеживая действия пользователей (покупки, просмотры и уход со страницы), ИИ в реальном времени учится корректировать вид страницы, чтобы повысить вероятность покупки.
Для кастомизации страниц Alibaba применяет на Taobao форму обучения с привлечением учителя – обучение с подкреплением[13].
Если алгоритмы в реальном времени учатся собирать данные пользователей в большом объеме на действиях клиентов, это долгий процесс. Для бизнеса здесь есть риски. Чтобы их снизить, создали виртуальный двойник Taobao: он симулирует поведение пользователей, объем – 100 тысяч часов реальных данных.
При таком количестве данных алгоритмы знакомятся с более широким диапазоном действий пользователей за более короткий период времени.
У Alibaba есть свой чат-бот Dian Xiaomi. Он отвечает на более чем 350 млн пользовательских запросов в день и 90 % из них понимает правильно. Перечисленные инструменты нужны ему в периоды пиковой активности клиентов – во время акций, например в День холостяков на Аlibaba[14].
Автоматическое создание карточки товараНа сайтах Alibaba – миллионы товаров, поэтому компания автоматизировала генерацию контента, чтобы не описывать каждый пункт вручную. Шаблоны предоставляются и сторонним продавцам.
ИИ-копирайтер использует алгоритмы обработки естественного языка на нейронных сетях глубокого обучения и выдает 20 тыс. строк в секунду[15].
Раньше копирайтеры, работающие в продажах, часами изучали списки ключевых слов и частоту кликов, чтобы понять, что заставит клиента кликнуть на ссылку в результатах поиска. А с появлением ИИ анализ запускается одним нажатием кнопки.
Вот что происходит: многочисленные версии рекламы прогоняются через алгоритмы, обученные на данных по пользовательскому поведению. Система определяет, какие сочетания слов чаще приводят к нажатию на ссылку, и вносит их в карточку товара.
Облачные сервисыКак Amazon и Google, Alibaba предлагает бизнес-клиентам ИИ-услуги облачного сервиса – крупнейшего в Китае[16].
В предложение входит платформа машинного обучения ИИ. Она содержит решения для компаний, которым нужны когнитивные вычисления (обработка естественного языка и компьютерное зрение), но у которых пока не хватает финансов на собственную инфраструктуру.
На конкурсе Стэнфордского университета технология обработки естественного языка Alibaba победила человека в состязании, кто лучше поймет прочитанное.
В 2018 году технология обработки языка на глубоких нейронных сетях прошла тест из 100 тыс. вопросов и победила человека со счетом 82,44: 82,3[17].
«Умные города»Alibaba разработала специальные инструменты, чтобы автоматизировать управление транспортными потоками, освещение, сбор мусора и другие задачи в городах с сетевой инфраструктурой.
Alibaba City Brain регулирует движение на всех улицах Ханчжоу – города с населением 9,5 млн человек. По данным системы, дорожные пробки сократились на 15 %[18]. Вскоре такую же технологию внедрят в малайзийском Куала-Лумпуре.
City Brain отслеживает дорожное движение и по собственным моделям прогнозирует места возникновения заторов. Обнаружив такое место, он изменяет режим светофоров в этой зоне, чтобы не возникали пробки.
Умными билетными автоматами в шанхайском метро тоже управляет ИИ Alibaba. Автомат выдает информацию по маршруту в ответ на запрос и идентифицирует личность пользователя с помощью технологии распознавания лиц[19].
«Умная ферма»Alibaba разработала ИИ-систему наблюдения за скотом, сельскохозяйственными и плодовыми культурами.
Крупнейшие в мире поставщики свинины – китайские фермеры – получили доступ к технологиям, которые контролируют активность и здоровье животных и сами решают, увеличить животному порцию или заставить его больше двигаться[20].
Растущее население надо чем-то кормить, и система позволяет фермерам быстрее воспроизводить поголовье, улучшать здоровье скота и снизить смертность новорожденных животных. Система также поможет выращивать сельскохозяйственные культуры и разумно использовать землю.
Академия открытий, проектов, динамики и перспективСтратегия ИИ компании Alibaba основана на том, чтобы предоставить компаниям и частным клиентам передовые технологии машинного обучения и решения глубокого обучения через облачные сервисы.
ИИ-платформы доступны для бизнеса через облачную структуру, которая объединяет 18 международных центров данных. Там установлено оборудование для предоставляемых в качестве услуг ИИ-алгоритмов и технологий обработки данных.
В 2017 году Alibaba анонсировала, что в следующие три года инвестирует 15 млрд долларов в расширение международной сети исследований и опытного производства ИИ. Программа называется «Академия открытий, проектов, динамики и перспектив» (Academy for Discovery, Adventure, Momentum and Outlook – DAMO). Для работы в лабораториях в Пекине и Ханчжоу в Китае, в Сан-Матео и Бельвью в США, а также в Москве, Тель-Авиве и Сингапуре наймут 100 исследователей[21]. Они сосредоточатся на машинном обучении, обработке естественного языка, интернете вещей, взаимодействии человека и машины и квантовых вычислениях.
Самое главное• Alibaba – крупнейший китайский инвестор в исследования и развитие ИИ, что дает компании фору в гонке за лидерство в этой сфере.
• Модель предоставления ИИ многочисленным частным клиентам и компаниям основана на облачном сервисе. Клиенты ничем не рискуют и экономят на создании инфраструктуры, а Alibaba получает доступ к ценным данным о поведении пользователей.
• Применяя технологии повышения продаж в решении других общественных и бизнес-задач, Alibaba расширяет область применения ИИ внутри и за пределами своего бизнеса.
2. Alphabet и Google. Как преумножить потенциал ИИ
Международная группа компаний Alphabet размещается в США. Она специализируется на интернет-сервисе, технологиях и медико-биологических исследованиях. Среди прочих сюда входят поисковик Google, медико-технологическая компания Verily, производитель беспилотников Waymo, создатель устройств для «умного дома» Nest и Deep Mind – разработчик ИИ.
В 2017 году Сергей Брин, президент Alphabet, заявил: «Новый скачок в развитии ИИ – самое значительное событие в компьютерной области за всю мою жизнь»[22], то есть важнее создания интернета.
В Alphabet осознают потенциал ИИ и применяют его во всех сферах: в оптимизации поисковиков, в беспилотных автомобилях, «умных домах», виртуальных помощниках, языковых переводах и медицинских технологиях.
Как Alphabet использует ИИ«Умный» поиск
Самый популярный в мире поисковик Google оснащен ИИ. Текстовые и голосовые запросы и изображения обрабатывает умная самообучающаяся система – с 2015 года, когда был запущен RankBrain[23].
Текстовый и голосовой поиск основан на обработке естественного языка: алгоритмы оценивают слова в контексте, а не по отдельности. Это семантический анализ.
В поиске по картинкам компьютерное зрение распознает и классифицирует данные об изображении, чтобы пользователи могли найти его текстовым или голосовым поиском. Алгоритмы глубокого обучения постоянно совершенствуются в том, чтобы распознавать и классифицировать отдельные элементы изображения. Чем больше учебных картинок обрабатывает машина, тем лучше понимает, что на них представлено.
Когда ИИ Google проанализировал запрос и предположил, что вам нужно, он сразу обращается к каталогу онлайн-контента: веб-страниц, изображений, видео и документов. Они уже обработаны системой машинного обучения.
Системы учатся сортировать, ранжировать и фильтровать контент каталога. Каждая единица контента оценивается по количеству ссылок на нее, точности содержащейся в ней информации. Также ИИ проверяет, не спам ли это или реклама и не нарушает ли контент закон или авторские права.
Обычный поиск Google – это множество сложных, мгновенно выполняемых вычислений ИИ. Системы, способные ежедневно осуществлять миллиарды вычислений, вознесли Alphabet и Google на вершину и принесли невероятную прибыль.
Google использует ИИ для других целей, например чтобы обеспечить безопасность аккаунтов Gmail и сервиса контекстной рекламы, которую показывают только потенциально заинтересованным пользователям.
Персональный помощник на базе ИИПерсональный помощник с голосовым управлением на основе ИИ появился несколько лет назад. Сегодня всем известны Google Home, Amazon Alexa и Apple Siri.
Поначалу обработка естественного языка в пользовательских устройствах впечатляла, особенно по сравнению с недавним прошлым, но обнаружились ее ограничения. ИИ хорошо понимает только элементарные и короткие предложения и команды. Попробуйте поговорить с ним, как с обычным человеком, – и он сразу запутается.
По человеческим меркам нынешний ИИ – младенец. А если говорить на языке науки, ему не хватает данных. Но он быстро растет, например благодаря технологии Google Duplex. Она поддержит и довольно неформальную беседу, потому что обучена для конкретных ситуаций, и алгоритмы собирают только касающиеся этих событий данные. Google демонстрирует прогресс Duplex на примере записи в парикмахерскую по телефону[24]. В таких узких и контролируемых случаях технология ведет себя почти по-человечески. Для этого инженеры Google запрограммировали свойственные нашей речи междометия: машина вставляет в разговор «эм-м», «ах» и «угу», когда сочтет это уместным.
Языковой переводКомпьютер можно научить говорить на одном языке, а любой другой он освоит сам с помощью машинного обучения. По этому принципу работает переводчик Google, раскладывая язык на основные составляющие. Глубокие нейронные сети Google Translate постоянно оттачивают алгоритмы, изучая новые языки, и так совершенствуются в точности переводов. Google внедрила эту функцию в наушники Pixel Buds на базе Google Assistant, и пользователи могут слушать трансляцию перевода почти в режиме реального времени[25].
Беспилотные автомобилиУ Waymo – подразделения Alphabet, которое разрабатывает беспилотные автомобили, – одна из самых развитых платформ в мире. Недавно компания стала первым коммерческим перевозчиком[26].
Alphabet пошел еще дальше: автомобили полностью автоматизированы, в них даже нет руля и педалей. Они созданы для новой урбанистической эпохи, в которую быть владельцем автомобиля – дорого и неудобно. Сервис Waymo ориентирован на частный извоз: по прогнозам компании, такой формат будет основным в умных городах будущего.
Субтитры к миллионам видеозаписейВ машинном обучении Google использует алгоритмы естественного языка, когда автоматически записываются субтитры для слабослышащих (или предпочитающих тишину) людей на сервисе потокового видео YouTube. Как и с речью, для идентификации звуков (аплодисментов, музыки) система использует глубокие нейронные сети и автоматически выводит текст: он сообщает зрителю, что происходит[27].