Полная версия
Искусственный интеллект. Начало новой технологической революции: вызовы и возможности
Р. Маков
Искусственный интеллект. Начало новой технологической революции: вызовы и возможности
Искусственный интеллект и новая технологическая революция: введение
На протяжении всей истории человечества мы стремились создавать машины и механизмы, способные облегчить нашу жизнь, взять на себя часть наших задач и функций. От первых простейших орудий труда до сложнейших современных компьютеров – все эти изобретения были призваны расширить возможности человека, усилить его интеллектуальные и физические способности. И вот сейчас мы стоим на пороге нового этапа этого вечного стремления – создания искусственного интеллекта (ИИ), машинного разума, способного не просто выполнять заданные человеком алгоритмы, но и самостоятельно обучаться, принимать решения, созидать.
Концепция искусственного интеллекта будоражит умы ученых, философов, писателей и обычных людей уже не одно десятилетие. От забавных историй о говорящих роботах до мрачных антиутопий о восстании машин – образ мыслящего компьютера прочно вошел в нашу культуру и массовое сознание. Но за этими фантазиями и страхами стоит реальная научно-техническая революция, разворачивающаяся прямо сейчас, на наших глазах. Революция, способная изменить практически все аспекты нашей жизни – от экономики и промышленности до медицины и образования, от искусства и творчества до человеческих отношений и самой природы разума.
Искусственный интеллект – это не просто еще одна новая технология в ряду многих других. По своему потенциальному воздействию на цивилизацию он сравним с такими эпохальными изобретениями, как колесо, электричество, компьютер или интернет. Возможно даже, что его влияние окажется еще более глубоким и всеобъемлющим. Ведь все предыдущие технологии были лишь инструментами в руках человека, тогда как ИИ впервые дает нам возможность создать нечто равное себе по интеллекту, а в перспективе – и превосходящее наши собственные когнитивные способности.
Уже сегодня системы на базе машинного обучения и нейросетей демонстрируют поразительные результаты в таких областях, как распознавание образов и речи, анализ больших данных, игра в шахматы и другие интеллектуальные игры, автоматический перевод и даже творчество. Они помогают врачам ставить диагнозы, биологам – исследовать геном, физикам – моделировать Вселенную. Они управляют сложнейшим производством, оптимизируют логистику, прогнозируют экономические тренды. Практически нет такой сферы человеческой деятельности, где интеллектуальные алгоритмы не могли бы принести пользу и показать результаты, недостижимые для человека.
И это только начало. С каждым годом технологии машинного интеллекта становятся все более совершенными, охватывают все новые области. Сегодняшние узко специализированные системы постепенно эволюционируют в сторону все более универсальных, гибких и автономных решений. В лабораториях по всему миру идет работа над созданием нейроморфных чипов, воспроизводящих структуру биологических нейронов, квантовых компьютеров, способных за секунды решать задачи, на которые у традиционных машин ушли бы тысячелетия, гибридных систем, объединяющих возможности естественного и искусственного интеллекта. Горизонты развития этих технологий кажутся поистине безграничными.
Но чем более могущественным становится искусственный разум, тем больше вопросов и вызовов он ставит перед нами. Как изменится рынок труда и система образования в мире, где многие интеллектуальные профессии будут доступны машинам? Как обеспечить безопасность и надежность все более автономных систем? Где проходит граница между помощью ИИ человеку и его порабощением в мире тотальной автоматизации? Наконец, возможен ли по-настоящему сильный, общий ИИ, не уступающий человеческому интеллекту, и что произойдет, когда он будет создан? Все эти вопросы требуют глубокого осмысления уже сегодня.
Путь развития искусственного интеллекта – это одновременно и путь познания собственной природы человека. Моделируя разум в кремнии и алгоритмах, мы невольно задаемся вопросами – а что же такое разум сам по себе? Что делает нас людьми? Разум, самосознание, свобода воли, эмоции, творчество – возможно ли воспроизвести все это в машине, и если да, то будет ли она тогда чем-то принципиально отличаться от нас самих?
В этой книге мы попробуем разобраться в феномене искусственного интеллекта со всех сторон – технологической, научной, экономической, социальной, философской. Мы проследим историю идеи мыслящих машин от первых наивных представлений до новейших научных разработок. Посмотрим, как развитие технологий машинного разума меняет и уже изменило различные сферы человеческой деятельности. Обсудим открывающиеся перспективы и потенциальные риски и угрозы. Попытаемся заглянуть в будущее интеллектуальных систем и нашего собственного с ними сосуществования.
Искусственный интеллект – это, возможно, главный вызов и главная возможность, стоящие сегодня перед цивилизацией. От того, как мы ответим на этот вызов, как реализуем эту возможность, зависит облик нашего мира в ближайшие десятилетия. Осмыслить происходящее, подготовиться к надвигающимся переменам – вот задача, которую ставит перед собой эта книга. Присоединяйтесь к нашему исследованию – будущее начинается прямо сейчас.
Раздел 1. Искусственный интеллект как технология
.1.
История создания и разработки искусственного интеллекта
Идея создания мыслящих машин, способных выполнять сложные задачи и даже превосходить человеческий разум, уходит корнями в глубокую древность. На протяжении веков философы, ученые, изобретатели пытались понять природу интеллекта и воспроизвести его в механических устройствах. Этот долгий путь, полный удивительных открытий, грандиозных замыслов и горьких разочарований, привел в конечном итоге к рождению современной науки об искусственном интеллекте.
1.1.1. Древние представления об автоматах и механизмах: философский аспект
Уже в античной философии мы находим первые размышления о возможности создания искусственных существ, наделенных разумом. Так, древнегреческий мыслитель Аристотель в своем трактате "О душе" рассуждает о различных видах души – растительной, животной и разумной, присущей только человеку. Однако он допускает, что некоторые функции разумной души, такие как способность к суждению и умозаключению, могут быть воспроизведены в неодушевленных предметах.
В диалоге Платона "Евтифрон" главный герой рассказывает о механических статуях богов, созданных легендарным изобретателем Дедалом. Эти статуи могли двигаться и даже издавать звуки, как будто были живыми. Хотя Платон использует этот образ скорее в метафорическом смысле, он отражает древнюю мечту человека о создании искусственной жизни.
В эпоху эллинизма появляются первые реальные автоматы – механические устройства, способные самостоятельно выполнять заданные функции. Так, древнегреческий математик и инженер Герон Александрийский создал множество удивительных машин, включая автоматический театр марионеток, приводимый в действие системой противовесов и рычагов, и автомат для продажи "святой" воды в храмах, работающий по принципу монетоприемника.
В древнем Китае также были известны искусные механизмы, имитирующие движения живых существ. Например, в трактате "Шу цзин" упоминается об императоре Му-вана (X век до н.э.), который приказал сделать механическую птицу, способную летать и петь. А во II веке н.э. изобретатель Ма Цзюнь создал деревянную куклу-музыканта, которая могла исполнять мелодии на струнном инструменте цине.
Средневековые исламские ученые внесли большой вклад в развитие автоматики и механики. Братья Бану Муса в IX веке написали "Книгу об искусных устройствах", где описали десятки удивительных механизмов, включая автоматические музыкальные инструменты, фонтаны и даже человекоподобного робота, служившего для развлечения гостей на пирах. Выдающийся персидский ученый Аль-Джазари в начале XIII века создал целый ряд программируемых автоматов, таких как робот-музыкант и "слуга" для подачи напитков.
В эпоху Возрождения идея мыслящих машин приобретает новое звучание в свете гуманистических идей о безграничных возможностях человеческого разума. Леонардо да Винчи оставил множество чертежей и записей о механических устройствах, включая человекоподобного робота-рыцаря, способного двигать руками, головой и открывать забрало шлема. Хотя неизвестно, был ли этот робот когда-либо построен, сама идея механического человека захватила умы многих мыслителей той эпохи.
Философы и ученые Нового времени продолжили размышления о природе разума и возможности его воспроизведения в машине. Рене Декарт в трактате "Рассуждение о методе" проводит четкую границу между человеком и животным, утверждая, что последние представляют собой не более чем сложные биологические автоматы, лишенные мышления и самосознания. В то же время он допускает, что совершенный искусственный человек теоретически возможен, хотя и крайне маловероятен на практике.
Готфрид Лейбниц, один из величайших умов своего времени, был увлечен идеей создания универсального логического языка и "вычислительной машины", способной решать любые задачи путем строгих математических расчетов. Хотя его проект остался нереализованным, он предвосхитил некоторые ключевые идеи современной информатики и искусственного интеллекта.
В XVIII веке получили распространение так называемые "автоматоны" – механические устройства, способные имитировать движения людей и животных. Наиболее известны работы французского изобретателя Жака де Вокансона, создавшего механическую утку, которая могла крякать, махать крыльями, клевать зерно и даже "переваривать" пищу. Хотя эти автоматы были чисто механическими и не обладали признаками интеллекта, они подготовили почву для дальнейших исследований в области робототехники и ИИ.
1.1.2. Появление компьютеров и основы искусственного интеллекта
Настоящий прорыв в развитии идеи искусственного разума произошел в XX веке с появлением первых цифровых вычислительных машин. Математическая теория вычислений, разработанная Аланом Тьюрингом, Клодом Шенноном и другими пионерами информатики, заложила фундамент для моделирования процессов человеческого мышления на компьютерах.
В 1950 году Алан Тьюринг публикует свою знаменитую статью "Вычислительные машины и разум", где предлагает эмпирический тест (позднее названный тестом Тьюринга) для проверки способности машины мыслить. Суть теста заключается в том, что человек-судья ведет диалог с двумя невидимыми собеседниками, один из которых является человеком, а другой – компьютерной программой. Если по итогам диалога судья не может определить, кто из собеседников является машиной, то эта машина считается прошедшей тест, то есть продемонстрировавшей поведение, неотличимое от человеческого интеллекта.
Хотя тест Тьюринга до сих пор остается предметом философских споров и критики, он стал важной вехой в истории ИИ, задав критерий оценки интеллектуальности машин и стимулировав дальнейшие исследования в этой области.
В 1956 году на конференции в Дартмутском колледже (США) состоялось официальное "рождение" искусственного интеллекта как научной дисциплины. Организаторы конференции – Джон Маккарти, Марвин Минский, Натаниэль Рочестер и Клод Шеннон – предложили амбициозный проект по созданию машин, способных "использовать язык, формировать абстракции и концепции, решать задачи, сейчас подвластные только человеку, и совершенствовать себя". Хотя многие из этих целей до сих пор остаются недостигнутыми, Дартмутский семинар задал направление развития искусственного интеллекта на десятилетия вперед.
В 1960-е и 1970-е годы в попытках разработки первых интеллектуальных программ доминировал подход, основанный на символьных вычислениях и логическом программировании. Исследователи пытались формализовать процессы человеческого мышления с помощью строгих математических правил и алгоритмов. Были разработаны первые языки программирования для ИИ, такие как Лисп и Пролог, и созданы первые системы, способные доказывать теоремы, играть в шахматы, понимать простую человеческую речь.
Однако вскоре стало ясно, что этот подход имеет серьезные ограничения. Многие аспекты человеческого интеллекта, такие как восприятие, обучение, здравый смысл, оказались слишком сложными для формализации в виде четких правил и алгоритмов. Искусственный интеллект столкнулся с так называемой "проблемой знаний" – трудностью вложить в машину весь объем информации, необходимый для решения реальных задач.
В 1980-е годы на первый план выходят новые подходы к разработкам, основанные на математической статистике, теории вероятностей и нейронных сетях. Вместо попыток вручную запрограммировать интеллект исследователи стали "обучать" машины на больших массивах данных, позволяя им самостоятельно находить скрытые закономерности и принимать решения. Хотя идея искусственных нейронных сетей, имитирующих структуру биологического мозга, была предложена еще в 1940-е годы, только с появлением мощных компьютеров и больших объемов данных этот подход стал приносить впечатляющие результаты.
Конец XX и начало XXI века ознаменовались настоящим бумом в развитии ИИ. Благодаря экспоненциальному росту вычислительных мощностей, доступности огромных массивов данных и прорывам в алгоритмах глубокого обучения, машины научились распознавать образы и речь, переводить тексты, управлять автомобилями, диагностировать болезни и даже создавать произведения искусства на уровне, близком к человеческому или даже превосходящем его.
Сегодня искусственный интеллект из области научной фантастики превратился в реальную технологию, которая все глубже проникает в нашу повседневную жизнь. Голосовые помощники в смартфонах, рекомендательные системы в онлайн-магазинах, чат-боты в службах поддержки, алгоритмы распознавания лиц в системах безопасности – все это примеры практического применения рассматриваемой технологии, с которыми мы сталкиваемся каждый день.
Однако, несмотря на впечатляющие успехи, современный искусственный интеллект все еще остается "узким" и специализированным, способным решать только конкретные задачи, на которых он обучен. Создание "сильного" ИИ, сравнимого по универсальности и гибкости с человеческим интеллектом, остается пока делом будущего. Но темпы развития технологий позволяют предположить, что это будущее может быть не таким уж далеким.
История искусственного интеллекта – это история борьбы человеческого разума за познание самого себя, за воспроизведение своих способностей в материальном мире. От первых наивных механических автоматов до современных нейронных сетей – каждый шаг на этом пути приближал нас к пониманию того, как работает наше собственное мышление, и к созданию его искусственного подобия. И хотя конечная цель – машина, неотличимая от человека по интеллекту – может быть еще далека, сам путь к ней уже изменил наш мир и наше представление о себе. В следующих главах мы подробнее рассмотрим современное состояние и перспективы развития этой захватывающей технологии.
1.2. Текущий уровень развития технологии
1.2.1. Современные подходы к разработке ИИ: машинное обучение и глубокое обучение
Искусственный интеллект сегодня – это бурно развивающаяся область, в которой постоянно появляются новые подходы и технологии. Однако большинство современных систем основаны на двух ключевых концепциях: машинном обучении и глубоком обучении.
Давайте начнем с машинного обучения. По сути, это подход к созданию интеллектуальных систем, при котором машина не программируется явно для решения конкретной задачи, а «учится» решать ее самостоятельно на большом массиве примеров. Вместо того чтобы вручную прописывать все правила и алгоритмы, разработчик просто «скармливает» программе огромное количество данных и позволяет ей самой найти в них закономерности и выработать стратегию решения.
Представьте, что вы хотите научить компьютер различать на фотографиях кошек и собак. Классический подход предполагал бы, что вы вручную опишете все ключевые признаки этих животных: форму ушей, длину хвоста, характерный окрас и т.д. Затем закодируете эти признаки в виде строгих правил и условий: если уши треугольные и хвост пушистый – значит кошка, если уши висячие и хвост короткий – собака. Несложно догадаться, что такой подход был бы крайне трудоемким, а созданная система – хрупкой и негибкой. Малейшее отклонение от заданных шаблонов – и она даст сбой.
Машинное обучение предлагает принципиально иной путь. Вместо того чтобы учить компьютер конкретным признакам, мы даем ему тысячи фотографий кошек и собак и просто говорим, где какое животное изображено. Программа сама, методом проб и ошибок, подбирает признаки и закономерности, которые наилучшим образом позволяют различать эти два класса. По сути, она «учится на опыте», как ребенок, которому много раз показывали кошек и собак и называли их, пока он не научился распознавать их самостоятельно.
Это очень мощная идея, кардинально изменившая подход к созданию искусственного интеллекта. Вместо того чтобы полагаться на человека-эксперта, который должен формализовать свои знания в виде правил (что далеко не всегда возможно), мы полагаемся на данные и способность машины самообучаться. Конечно, ключевым моментом здесь является наличие качественной обучающей выборки – достаточно большого и репрезентативного набора примеров. Но в современном мире Больших Данных, где каждый наш клик, покупка или запрос в поисковике сохраняются и анализируются, недостатка в таких выборках, как правило, нет.
Сфера применения машинного обучения колоссальна – от распознавания речи и изображений до прогнозирования курсов акций и диагностики заболеваний. По сути везде, где есть некоторый массив данных, отражающих какую-то часть реальности, можно применить этот подход, чтобы найти в этих данных неочевидные взаимосвязи, закономерности, спрогнозировать будущее поведение системы.
Среди последних впечатляющих достижений машинного обучения – создание нейросетевых языковых моделей, способных генерировать осмысленные и связные тексты на любую тему, почти неотличимые от написанных человеком. Или алгоритм AlphaFold от DeepMind, который научился предсказывать трехмерную структуру белков по их генетической последовательности – задача, над которой бились лучшие умы биоинформатики десятилетиями.
Разнообразие методов и алгоритмов
Машинное обучение – это целое семейство подходов и алгоритмов. В зависимости от типа решаемой задачи, характера доступных данных и желаемого результата используются разные «обучающие» стратегии.
Обучение с учителем – пожалуй, самый распространенный вид машинного обучения. В этом случае у нас есть размеченный дата-сет – набор примеров, для каждого из которых уже известен правильный ответ. Допустим, коллекция фотографий, где для каждой указано, кошка на ней или собака. Задача алгоритма – найти функцию, которая будет максимально точно отображать входные данные (матрицу пикселей изображения) в выходные метки классов (кошка/собака). После обучения это позволит классифицировать новые, ранее не виданные фотографии.
Обучение без учителя имеет дело с неразмеченными данными. Здесь нет явной задачи классификации или прогноза, вместо этого алгоритм пытается самостоятельно найти какую-то структуру и закономерности в массиве данных. Например, кластеризовать объекты так, чтобы похожие были в одной группе, а непохожие – в разных. Или снизить размерность данных, выделив их ключевые признаки. Такой анализ часто помогает лучше понять природу изучаемых объектов и процессов.
Обучение с подкреплением – подход, вдохновленный бихевиористской психологией. Здесь обучающийся агент (например, робот или игровой ИИ) обучается в процессе взаимодействия с некоторой средой. Он совершает действия и получает от среды «награды» или «наказания» в зависимости от результата. Цель агента – выработать стратегию поведения, максимизирующую суммарную награду. Именно на этом принципе построено обучение знаменитого ИИ AlphaGo, обыгрывающего чемпионов мира в го.
Глубокое обучение и нейросети – прорыв, изменивший всё
Особого упоминания заслуживает глубокое обучение – подраздел машинного обучения, связанный с искусственными нейронными сетями. Хотя сами по себе нейросети известны с 1940-х годов, именно в последнее десятилетие благодаря росту вычислительных мощностей и объемов данных они совершили настоящую революцию, многократно повысив эффективность ИИ в таких сферах как компьютерное зрение, обработка естественного языка, управление роботами и многих других.
Нейронные сети – это особый вид алгоритмов, структурно имитирующих строение биологического мозга. Они состоят из множества простых вычислительных единиц – «нейронов», соединенных связями-«синапсами». Каждый нейрон получает сигналы от других, суммирует их с некоторыми весами и при достижении порога активации посылает собственный сигнал дальше по сети. Обучение нейросети заключается в подборе этих весов так, чтобы при подаче на вход определенных данных на выходе появлялся желаемый результат.
Ключевая особенность нейросетей, отличающая их от других методов машинного обучения – способность автоматически выделять иерархии признаков из необработанных данных. Если на вход обычного МО-алгоритма нужно подавать уже готовые, выделенные человеком признаки объектов (например, длину лепестков для классификации ирисов или частоту слов для анализа текстов), то нейросеть может работать непосредственно с «сырыми» данными – пикселями изображений, буквами текста, необработанным звуком – и сама находит в них глубинные абстрактные признаки.
Именно это свойство делает нейросети столь эффективными и универсальными. Многослойные, или «глубокие» нейросети (отсюда и название Deep Learning) способны выделять невероятно сложные и абстрактные паттерны и представления – такие как «концепт кошки» в наборе пикселей или «семантика предложения» в последовательности слов. При этом они показывают удивительную гибкость и переносимость между задачами: обученные на одном типе данных, они могут успешно применяться для анализа других, смежных типов.
Взрывной прогресс глубокого обучения в 2010-х связан с появлением новых архитектур нейросетей, таких как сверточные сети для обработки изображений, рекуррентные сети для работы с последовательностями (текстами, временными рядами), трансформеры и механизмы внимания для анализа структурированных данных, и многих других. Не последнюю роль сыграло и развитие аппаратного обеспечения, особенно графических процессоров (GPU), идеально подходящих для массивно-параллельных матричных вычислений, на которых основаны нейросети.
Именно глубокие нейросети лежат в основе таких впечатляющих ИИ-систем последних лет, как:
нейросетевые переводчики, не уступающие профессиональным лингвистам (Google Translate, DeepL);
системы генерации реалистичных изображений и произведений искусства по текстовому описанию (DALL-E, Midjourney, Stable Diffusion);
алгоритмы для игры в покер и другие игры с неполной информацией, превосходящие сильнейших игроков-людей (Pluribus, ReBeL);
самообучающиеся модели языка, способные к связному диалогу и рассуждению (GPT-4, LaMDA, RETRO);
нейросетевые ассистенты для программирования, автоматически генерирующие и исправляющие код (GitHub Copilot, AlphaCode).
Этот список можно продолжать долго, он пополняется буквально каждую неделю. Глубокое обучение совершило переворот в ИИ, продемонстрировав, что компьютеры способны решать задачи, которые раньше считались под силу только человеку, причем нередко делать это лучше и быстрее нас.
В то же время, нейросети при всей своей мощи и эффективности имеют и ряд серьезных ограничений и проблем. Один из их главных недостатков – непрозрачность работы. Если обычные МО-алгоритмы принимают решения на основе довольно понятных и интерпретируемых правил и признаков, то обученные нейросети являются типичным примером «черного ящика». Мы видим их впечатляющие результаты, но зачастую совершенно не понимаем, как они были получены, на что конкретно опиралась сеть в своем решении. Это порождает проблемы контроля, доверия, отладки таких систем.
Другая трудность – зависимость качества обучения нейросети от объема и качества данных. Для достижения хороших результатов современным нейросетям нужны действительно гигантские дата-сеты, на несколько порядков больше, чем требовалось классическим МО-алгоритмам. А качество этих данных должно быть очень высоким, поскольку нейросети склонны улавливать и усиливать малейшие закономерности и шумы в обучающей выборке. Сбор, разметка, очистка таких данных – сложный и дорогостоящий процесс.
Наконец, обученные нейросети недостаточно гибки и плохо обобщаются на данные, сильно отличающиеся от обучающих примеров. Если алгоритму распознавания котов показать картинку собаки, он с высокой вероятностью отнесет ее к котам, поскольку собак он никогда не видел. В то время как человек легко перенесет однажды выученный концепт «домашнего питомца» на новый объект. Пока нейросети не умеют учиться быстро и переносить знания между задачами, как это делаем мы.