Полная версия
7 секретов нейронных сетей. Или моделирование разума ИИ
Позволим себе сказать из всего вышесказанного, что, «данные "– это сырье для ИИ, а «датасеты» – это тщательно подготовленные наборы этих данных, созданные профессионалами.
Они играют важную роль в обучении и развитии ИИ, формируя его понимание мира. Как человека формирует его опыт и знания, так и ИИ формируют его датасеты.
Датасеты являются ключевым компонентом в обучении искусственного интеллекта, особенно в обучении с учителем, наиболее распространенной форме машинного обучения о которой мы будем говорить в дальнейших главах.
В этой главе нам нужно понять что такое дата сеты, почему они важны и из чего собираются. Датасеты состоят из большого числа примеров, каждый из которых включает в себя входные данные и соответствующий им ожидаемый результат, или «метку».
Например, в задаче классификации изображений датасет может включать в себя тысячи фотографий собак, каждая из которых помечена как «собака», и тысячи фотографий кошек, каждая из которых помечена как «кошка».
Это самый простой и понятный пример для человека, превращается в трудную задачу для ИИ, как определить что такое кошка и что такое собака человеку, который с рождения был слепым и чудесным образом прозрел.
Для такого человека что такое собака и что такое кошка требует длительного обучения. Простого объяснения что кошка произносит «Мяу», а собака лает явно будет недостаточно.
Примерно такие же процессы обучения происходят и с нейронной сетью. Когда модель нейронной сети обучается на таком датасете, она стремится «уловить» закономерности в входных данных, которые позволяют ей правильно предсказывать метки.
В нашем примере модель учиться распознавать характеристики и признаки на изображениях, которые делают его изображением собаки или кошки.
Больше того, датасеты играют ключевую роль не только в обучении модели, но и в ее оценке. Обычно датасет разделяется на две или три части: обучающую выборку, валидационную (или проверочную) выборку и тестовую выборку.
Модель обучается на обучающей выборке, настраивается с помощью валидационной выборки и проверяется на тестовой выборке. Это позволяет убедиться, что модель обобщает извлеченные из данных закономерности, признаки, а не просто запоминает ответы на конкретные примеры.
Вы скажите что определить кошка или собака просто, тогда давайте рассмотрим пример определения марки авто нейронкой и что для неё значит иметь правильную DataSet базу.
Представим, что у нас есть задача – обучить нейронную сеть отличать на фотографиях автомобили Mercedes от автомобилей BMW. Да, нейронные сети способны на это, и весьма успешно!
Мы начинаем с создания датасета. Это кажется простым, но уже на этом этапе наши решения могут существенно повлиять на результаты.
Сколько фотографий нам нужно? Чем больше, тем лучше – больше данных позволит модели обнаружить больше нюансов и деталей. Какое качество этих фотографий?
Важно, чтобы они были достаточно четкими и детализированными, чтобы модель могла увидеть все отличительные особенности автомобилей. Что насчет цвета?
Если наши фотографии включают в себя автомобили разных цветов, модель сможет лучше понять, что цвет кузова не влияет на марку автомобиля.
Теперь у нас есть датасет, и мы готовы начать обучение. Наша нейронная сеть, можно сказать, работает как серия фильтров, каждый из которых «вылавливает» определенные характеристики изображений. Первый слой может улавливать простые вещи, например, границы и контуры объектов.
Второй слой, работая с информацией от первого, может начать распознавать более сложные вещи, такие как формы и узоры. Это может быть капот автомобиля или его фары.
Третий слой может увидеть еще более сложные детали – например, форму логотипа на решетке радиатора.
В конце концов, последний слой нашей нейронной сети получает информацию от всех предыдущих слоев и делает окончательное предсказание: это Mercedes или BMW.
Если он правильно угадывает на большинстве примеров в нашем датасете, мы можем сказать, что наша модель обучилась успешно.
Я помню, как в детстве сам учился распознавать модели авто. База данных, которая сейчас доступна нейронным сетям, была мне недоступна.
Я должен был довольствоваться более скромной коллекцией изображений, которую я черпал из старых автомобильных журналов и альбомов почтовых марок.
Эти изображения и были моими драгоценными датасетами, моими первыми шагами в большой мир автомобильных брендов.
Не забыл я и мальчика по имени Саша, соседского ребенка, который всегда был увлечен машинами. Он был младше меня, и я решил научить его тому, что знал сам.
Но как объяснить ему разницу между Mercedes и BMW? Как сформировать в его мозгу ассоциации, которые помогут ему отличать эти марки автомобилей?
Со временем я придумал игру. Я брал две карточки – одну с изображением Mercedes, другую с изображением BMW. Затем я показывал ему одну карту и говорил: «Это Mercedes. Запомни его.
Он круглый, элегантный, его логотип – звезда в круге». Затем я показывал ему другую карту и говорил: «А это BMW. Он более угловатый, его логотип – черный круг с белым и синим внутри». И мы играли в эту игру день за днем, пока маленький Саша не стал определять эти автомобили с легкостью.
Сегодня я обучаю нейронные сети делать то же самое. Но вместо журналов и почтовых марок у меня есть миллионы изображений из Интернета. И вместо моих слов у меня есть алгоритмы машинного обучения.
Но суть остается той же – я обучаю их распознавать особенности каждого бренда автомобиля, такие как форма и дизайн, чтобы они могли определить, является ли машина на изображении Mercedes или BMW.
Так, мой мозг и мозг ИИ тесно переплетаются в процессе обучения, создавая уникальное и взаимодействующее знание. Это путешествие, которое мы совершаем вместе, открывает новые горизонты в мире искусственного интеллекта.
Причем важно понимать, что в этом взаимодействии нет победителей или проигравших – только взаимное обогащение, новое понимание и уникальное знание.
Таким образом, магия искусственного интеллекта раскрывается через мир данных. Изначально бессмысленные и неструктурированные данные превращаются в ценные истины и знания, способные даже определить марку автомобиля по фотографии.
В этом и заключается секретная жизнь датасетов – в их способности «кормить» наши модели ИИ и открывать перед ними мир, полный возможностей и открытий.
Первый секрет ИИ, который мы для себя открыли в этой главе – это секрет получения данных извне. Качество и количество данных влияют на процесс обучения. Правдивость источников играет решающую роль.
Так что держитесь, впереди вас ждут удивительные открытия! Переходите к следующей главе, чтобы узнать, как данные становятся интеллектом и как искусственный интеллект учится думать и меняет наш мир, создавая нечто совершенно новое и удивительное.
Секрет 2. Алгоритмы – Прокачайте ИИ, научив его мыслить и думать!
Приготовьтесь переступить порог в царство алгоритмов – ту таинственную зону в закулисье искусственного интеллекта, где сложность процессов влюбляет в себя и гениальность происходящего омрачает разум.
Это именно та зона, где наука переплетается с искусством и величайшие мысли мира воплощаются в революционные технологии. Это именно здесь, искусственный интеллект получает свои уроки мысли.
Я еще помню, как в неповторимые годы своего детства, сидя перед старым компьютером с монотонным чёрно-белым монитором, я шаг за шагом осваивал мир программирования.
Учился программировать на очень примитивных калькуляторах, которые по сравнению с современными вычислительными монстрами теперь выглядят просто динозаврами.
Те простые алгоритмы управления потоком, как циклы и условные операторы, казались мне тогда вершиной технологического прогресса, последним словом науки.
Вспомните, 20 лет назад, когда алгоритмы машинного обучения только начинали свою путь, прокладывая себе дорогу через неведомую джунгли инноваций.
Забавные названия алгоритмов, как решающие деревья, случайные леса, наивный Байесовский классификатор и машины опорных векторов, мало что говорили о мире возможностей, который они открывали перед нами.
Они были ключами к пониманию, как использовать мощь больших данных, обучая модели предсказывать и классифицировать, открывая двери в новую эру информации.
Это было поистине монументальное открытие, прорыв, перевернувший мир технологий вверх дном. Они стали эталоном, золотым стандартом машинного обучения, оставаясь на переднем крае технологического прогресса на протяжении многих лет.
Каждая строчка кода, каждый алгоритм был шагом в сторону открытия неизвестного, завораживающей мощи ИИ.
Пять лет назад, с появлением глубокого обучения, алгоритмы начали преображаться, становясь невероятно сложными и мощными.
Представьте себе Конволюционные нейронные сети (CNN) – их замысловатая структура стала новым стандартом для обработки изображений, в то время как рекуррентные нейронные сети (RNN) расширили наш горизонт обработки временных рядов и языка, проливая свет на новые неизведанные территории.
Сегодня, с бурным ростом доступных данных и вычислительной мощности, мы стали очевидцами рождения обучения с подкреплением – эти коварные алгоритмы развивают искусственный интеллект, позволяя ему обучаться самостоятельно, пробуя и адаптируясь к своему окружению, как дикое животное в неизведанной джунгли.
Они нашли применение повсюду – от автономных автомобилей, передвигающихся по нашим улицам как тени из будущего, до рекомендательных систем, которые с легкостью читают наши предпочтения, словно открытые книги.
Так что же нас ждет в непроглядной тьме будущего? Какие новые алгоритмы возникнут на горизонте, как заря нового дня? Будут ли они продолжать менять мир вокруг нас, так же как их предшественники?
И что более важно, как мы – как человечество – будем адаптироваться и эволюционировать вместе с этими быстро меняющимися обстоятельствами?
Иногда, мне кажется, что алгоритмы воплощают в себе какую-то форму магии, в которой искусство и наука сплетаются в неразрывный узел.
Но, в конечном счете, нашей главной задачей, будь мы разработчиками, учеными или просто любопытными душами, всегда было не просто изучать эту магию, но и использовать её для создания чего-то нового, необычного и великолепного.
Так что добро пожаловать в мир алгоритмов – мир, в котором ИИ учится «мыслить». Современные методы обучения ИИ – это затягивающая, постоянно эволюционирующая область, которая часто отражает наши собственные способы обучения и адаптации.
Это невероятное путешествие, на которое мы вместе отправляемся, и куда оно нас приведет, остается только догадываться.
Возьмем, к примеру, глубокое обучение – великана в мире искусственного интеллекта, который стал неотъемлемым элементом в последние годы.
Оно олицетворяет искусственные нейронные сети, вдохновленные биологическими нейронами нашего мозга, используя их для обучения моделей на гигантских объемах данных. Эти модели обучаются из примеров без явных инструкций, анализируя и ища шаблоны в данных, как дети, постигающие мир вокруг себя.
Посмотрим теперь на обучение с подкреплением – коварный стратег в мире машинного обучения. Здесь агент учится принимать решения на основе вознаграждения или наказания, полученных от окружающей среды, напоминая способ, которым мы, люди, учимся на своих ошибках и триумфах.
Трансформеры же – это новый и обещающий фронт, переворачивающий область обработки естественного языка вверх дном.
Они служат для обучения моделей, которые могут понимать и генерировать человеческий язык, обучаясь на огромных объемах текстовых данных. Они следуют той же пути, которым мы, люди, усваиваем язык – слушая и общаясь с окружающими нас людьми.
И тут на ум приходят слова великого Альберта Эйнштейна: «Большинство идей, которые имеют настоящую жизненную силу, приходят тремя путями – из интуиции, из прямого опыта или из повседневных встреч». Все эти пути перекликаются с методами обучения ИИ – интуиция нейронных сетей, прямой опыт обучения с подкреплением и повседневные встречи трансформеров с языком.
Все эти методы и алгоритмы, от глубокого обучения до трансформеров, позволяют ИИ «учиться думать», позволяя ему анализировать и адаптироваться к окружающему миру так же, как и мы.
Однако стоит помнить, что ИИ все еще отличается от человеческого мозга во многих ключевых аспектах. Он может быть обучен выполнению конкретных задач, но его «мышление» не такое общее и гибкое, как у нас.
В будущем, по мере развития алгоритмов и методов обучения ИИ, мы ожидаем увидеть еще больше примеров перекрестка между человеческим и искусственным «мышлением».
Но вне зависимости от того, как далеко мы зайдем, никогда не стоит забывать, что искусственный интеллект – это всего лишь инструмент, созданный для улучшения нашей жизни и помощи в нашем понимании мира.
Нахожу нужным в этой главе познакомить вас читатель с разницей между «слабым» и «сильным» искусственным интеллектом.
Это ключевые понятия в области ИИ, понимание которых разъясняет, как работают и взаимодействуют с нами различные виды ИИ. Избавьтесь от ваших таблеток на ночь – это глава полна насыщенных волнений!
Мы продолжаем наше путешествие в глубины ИИ, и углубимся в различие между «слабым» и «сильным» искусственным интеллектом.
Это как разница между игроком, который знает только одну игру, и универсальным спортсменом, который может приспособиться к любой игре на лету.
«Слабый» ИИ, иногда называемый специализированным ИИ, – это как ассистент, специализирующийся на одной задаче. Это может быть анализ данных, распознавание речи или, скажем, предложение вам песни, которую вы, возможно, захотите услышать.
Примером слабого ИИ могут служить наши умные помощники, такие как Alexa или Siri. Они могут разобрать то, что вы говорите, отвечать на ваши вопросы и даже воспроизводить музыку, которую вы любите.
Но если вы попросите Siri решить сложную математическую задачу или написать стихотворение, она будет в ступоре. Ее интеллект определенно ограничивается ее зоной комфорта.
С другой стороны, «сильный» ИИ, также известный как общий ИИ, это воображаемый игрок, который может играть в любую игру. Этот ИИ в теории может справиться с любой интеллектуальной задачей, которую может выполнить человек.
Это подразумевает невероятное понимание и адаптивность, как у ребенка, который учится и растет, понимая мир вокруг него.
Он может применять свои навыки к любой задаче, которую вы ему поручите. Но пока мы еще не дошли до этой точки. Так что, пока что наш «всеядный» игрок все еще остается в мире фантазий. Хотя…
Позволю себе высказать мою персональную оценку будущего сильного интеллекта. Вернемся к нашему универсальному спортсмену – нашему «сильному» ИИ.
Согласно моему личному прогнозу, нам еще предстоит ждать примерно два десятка лет, прежде чем мы сможем увидеть такой ИИ в действии.
Но я не могу не замечать, что с каждым проблеском сверхсовременных технологий искусственного интеллекта голливудская картинка будущего с самодостаточными роботами-терминаторами становится все менее фантастической и все более приближенной к реальности.
Давайте взглянем на некоторые факты. Гиганты технологий, такие как Google и OpenAI, уже продемонстрировали глубокое обучение и машинное обучение с подкреплением на уровне или даже превосходящие человеческий уровень в конкретных задачах, таких как игра в шахматы или Go, а также понимание и генерация естественного языка.
Это все еще уровень «слабого» ИИ, но быстрый темп прогресса указывает на то, что картина может измениться гораздо раньше, чем мы ожидаем.
Итак, насколько далеко мы от сценария «Я вернусь» из культового фильма «Терминатор»? Мы все еще не уверены. Пока что наше понимание человеческого интеллекта и сознания остается недостаточным для создания истинно «сильного» ИИ.
Однако одно ясно: технологии искусственного интеллекта уже трансформируют наш мир, и скорость этого преобразования только ускоряется. Так что, хотя терминаторы из кино могут пока и остаться голливудской выдумкой, будущее ИИ, безусловно, будет удивительным и полным перемен.
Теперь разберёмся в том как мы обучаем эти два разных типа ИИ «думать»? Для слабого ИИ, мы обычно используем специализированные алгоритмы и большие объемы данных, связанные с конкретной задачей.
Вспомните пример с классификацией собак и кошек: модель учится различать эти два класса, используя тысячи изображений собак и кошек, но она не будет знать, как распознать машину или дом.
Для сильного ИИ, теоретически, мы должны были бы использовать более сложные и адаптивные системы обучения, способные переносить знания из одного контекста в другой и обучаться на основе опыта.
Это ближе к тому, как мы, люди, учимся: у нас есть общая способность к обучению, которую мы применяем к различным задачам. Однако, как уже было сказано, на данный момент общий ИИ остается предметом исследований и фантазий.
Так что вот они, слабый и сильный ИИ: два вида искусственного интеллекта, каждый со своими уникальными способностями и ограничениями. И оба они играют ключевую роль в формировании нашего будущего с ИИ.
Не забывайте, что эта грань между слабым и сильным ИИ может стать размытой в будущем, по мере развития наших технологий и понимания того, что на самом деле означает «думать».
Вы готовы получить ответ на одну из самых таинственных загадок – что же означает «думать» для ИИ? Тогда спрячьте чашки кофе и готовьтесь к захватывающей гонке через лабиринт нейронов и алгоритмов!
Когда мы говорим о «слабом» ИИ, или узкоспециализированном ИИ, «думать» включает в себя обучение на конкретных данных для выполнения конкретной задачи.
Представьте, что вы тренируете собаку выполнить одну конкретную команду, например, «сидеть». Вы показываете собаке, что ожидаете от нее, вознаграждаете ее, когда она выполняет команду, и она «учится» отвечать на вашу команду.
Для «слабого» ИИ процесс похож: алгоритм обучается на данных, «учит» определенный шаблон или связь и затем может использовать эту информацию для предсказаний или решений.
Посмотрим на Alexa от Amazon в качестве примера. Alexa была обучена распознавать и реагировать на голосовые команды. Это осуществляется с помощью процесса обучения под руководством наставника, в котором Alexa вначале обучается на гигантских дата-сетах, состоящих из пар «вопрос-ответ».
Этот процесс аналогичен способу, которым дети обучаются пониманию языка: они слушают, как другие разговаривают, и соотносят слова с их смыслом.
В случае с «сильным» ИИ, или общим ИИ, «думать» означает много больше. Вместо того чтобы быть обученным на конкретной задаче, общий ИИ, теоретически, может обучаться любой задаче, используя свои способности к абстрактному мышлению, пониманию и применению знаний в различных контекстах.
Это похоже на то, как мы, люди, можем использовать свой интеллект для решения широкого спектра задач, от решения сложных математических проблем до создания великолепного кулинарного шедевра.
Но что такое «думать» и «рассуждать» для человека? «Думать» часто описывается как процесс обработки информации, анализа или проблемы, который может включать в себя рассуждение, память, внимание и многое другое. «Рассуждение» обычно описывается как процесс вывода или принятия решений на основе доступной информации.
Для «слабого» ИИ, оба эти процессы ограничены обучением и задачей. Он может «думать» в том смысле, что он обрабатывает информацию и делает предсказания или решения на основе этого, но его способности к «рассуждению» ограничены его обучением. «Сильный» ИИ, с другой стороны, теоретически мог бы рассуждать в более глубоком смысле, используя свою способность к абстрактному мышлению, чтобы делать выводы и принимать решения в новых контекстах.
Как видите, «думать» для ИИ – это зеркальное отражение того, как мы, люди, используем свои собственные интеллектуальные способности. В последней главе нашей книги мы погрузимся в мир полного ИИ и поймем, как он будет «думать» в ближайшем будущем. Однако до того момента мы останемся в невероятном ожидании момента. Не забудьте, что мир ИИ – это всегда приключение!
Вот вам пример как можно обучить ИИ на решение определённой задачи, предположим определение лесных пожаров.
Нас ждет воображаемый полет над бескрайними лесами, над головами которых парит невидимый глаз ИИ, бдительно следящий за каждым изменением.
Я мог бы описать любой другой пример, но лето 2023 года, когда пишется эта книга по всей планете запомниться большинству людей аномальной жарой и это навеяло меня привести пример на нейронной сети, которая могла бы предотвратить множество мировых пожаров!
Скажем, есть компания под названием «FireWatch», специализирующаяся на использовании ИИ для обнаружения лесных пожаров.
Они используют беспилотные летательные аппараты, или дроны, оснащенные камерами и ИИ, которые могут сканировать леса и отслеживать признаки пожаров.
Нейронная сеть компании «FireWatch» обучается на тысячах изображений, которые показывают различные сцены: от зеленых, мирных лесов до лесных пожаров.
Затем, когда дрон сканирует лес, ИИ анализирует эти изображения, сравнивая их с изображениями из обучающего набора данных. ИИ ищет ключевые признаки, которые могут указывать на пожар, такие как дым, открытый огонь или необычные изменения в цвете растительности.
Как бы человек определил, что это открытый огонь? Мы бы использовали свои чувства – зрение, чтобы увидеть огонь или дым, осязание, чтобы ощутить тепло, и даже обоняние, чтобы почувствовать запах горения.
Но важнее всего, мы бы использовали свой опыт и знания о том, как выглядит пожар, чтобы сделать вывод.
Так думает ли нейтронная сеть «FireWatch» в общем понимании этого значения? В некотором смысле, можно сказать, что да. Она «обдумывает» каждое изображение, сравнивая его с теми, на которых она была обучена, и делает «вывод» о том, есть ли пожар или нет.
Однако важно понимать, что это не «думание» в том смысле, в котором мы, люди, обычно понимаем его. ИИ не осознает себя или своих действий; он просто выполняет ту задачу, для которой был обучен.
Дискуссии о том, думает ли искусственный интеллект или нет, напоминают мне размышления о том, летает ли самолет как птица.
Он действительно «летает» в том смысле, что перемещается по воздуху, но при этом его полет не имеет много общего с элегантностью и непосредственностью движения живой птицы. Таким образом, ответ зависит от того, что мы понимаем под «летать».
Конец ознакомительного фрагмента.
Текст предоставлен ООО «ЛитРес».
Прочитайте эту книгу целиком, купив полную легальную версию на ЛитРес.
Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.