Просто про нейросети

Полная версия

Просто про нейросети

Name: Просто про нейросети
Rating: 4 (48 reviews)
Author: Александр Зарубин
ISBN: 9785006959866

текст

Александр Зарубин

Жанр: просто о бизнесе книги о компьютерах

Язык: Русский

Год издания: 2026

Добавлена: 08.04.26

О книге

Читать онлайн

Настройки чтения

Размер шрифта

Высота строк

Поля

<1 2 3 4 >

На страницу:

Перейти

3 из 4

Если ты уже разбираешься, то эта глава вообще то же самое для тебя, как смотреть инструкцию по сборке мебели из IKEA: вроде все понятно, но зачем, если ты уже собрал шкаф, не читая мануал?

Дальше будет простой пример создания нейросети для классификации изображений.

1. Выбор задачи

Выбираем простую задачу: классификация изображений. Например, мы можем создать нейросеть, которая будет определять, изображен ли на картинке кот или собака. Важно выбрать, какую задачу будет выполнять нейросеть. Именно задача определяет, какие данные и какую архитектуру модели нужно использовать.

2. Сбор данных

Для обучения нейросети нам понадобятся данные. В данном случае это будут изображения котов и собак. Можем использовать готовые наборы данных, такие как CIFAR-10 или MNIST, или собрать свои собственные изображения. Качество данных также играет ключевую роль. Если наберем плохих искаженных картинок с какими-нибудь водяными знаками или вообще битые файлы, исход будет неудовлетворительным.

3. Используем платформы с низким порогом входа

Для создания нейросети без глубоких технических знаний можно использовать платформы, такие как Google Colab или Kaggle. Эти платформы предоставляют доступ к мощным вычислительным ресурсам и предустановленным библиотекам, таким как TensorFlow и PyTorch.

4. Код модели как пример

Для классификации изображений (пример) используем сверточную нейросеть (CNN):

– Гиперпараметры: В коде используется оптимизатор adam и функция потерь categorical_crossentropy, но мы тут вам не объясняем, почему именно эти параметры выбраны. Можно было бы добавить краткое объяснение различных оптимизаторов и функций потерь, а также как выбрать подходящие гиперпараметры. Но давайте-ка сами. Тут уже будут слишком сложные технические нюансы для вас, обычных пользователей.

– Размер данных: В примере кода мы тут также не упоминаем, как выбрать размер обучающей и тестовой выборки. Можно было бы добавить рекомендации по разделению данных и важности сбалансированных выборок, но считаем, что это тут тоже излишне. Особенно в начале самой книги. У нас тут всего лишь образ – чтобы вы могли представить, как это все в общем плане выглядит.

Для более сложных задач может также потребоваться более сложная архитектура или дополнительные библиотеки.

5. Обучение модели

После создания модели ее нужно обучить на собранных данных. Это можно сделать прямо в Google Colab или Kaggle, используя их вычислительные ресурсы. Обучение может занять некоторое время в зависимости от размера данных и сложности модели.

В примере у нас рассматривается только классификация изображений, но нейросети могут использоваться для решения различных задач, таких как обработка естественного языка, временные ряды, рекомендации и т. д.

6. Тестирование и оценка модели

После обучения модель нужно протестировать на тестовых данных, чтобы оценить ее точность. Если результаты неудовлетворительны, можно попробовать изменить архитектуру модели или увеличить количество эпох обучения.

7. Развертывание модели

После того, как модель хорошенько у нас потренировалась и успешно прошла нашу проверку, разрешаем ей пуститься в работу. Для этого подойдут специальные сервисы вроде Heroku или AWS, которые помогают установить и управлять моделью на практике.

Поэтапный план действий:

1. Выбор задачи: Определяем задачу, которую хотим решить с помощью нейросети.

2. Сбор данных: Собираем или загружаем данные, необходимые для обучения.

3. Использование платформы: Выбираем платформу с низким порогом входа, такую как Google Colab или Kaggle.

4. Используем готовые примеры кода: или создаем свою модель с помощью библиотек, таких как TensorFlow или PyTorch.

5. Обучение модели: Обучаем модель на собранных данных.

6. Тестирование и оценка модели: Проверяем точность модели на тестовых данных.

7. Развертывание модели: Развернем модель в производственной среде с помощью платформ, таких как Heroku или AWS.

Что еще можно предусмотреть при создании собственной нейросети?

1) Предобработка данных. Может включать нормализацию, масштабирование, удаление шумов и т. д. Предобработка данных очень важна, на самом деле, и ее нельзя обходить стороной, если есть на нее время и ресурсы.

2) Оптимизация модели. Регуляризация, дропаут, нормализация по батчам и т. д.

3) Интерпретация модели. Поизучайте, как интерпретировать результаты модели и как оценить ее производительность, если собираетесь делать собственную нейросеть. Погуглите на досуге описание метрик оценки модели и их интерпретации.

Примерно так можно и самому сделать свою нейросеть для определенных задач.

Сколько денег тратят корпорации на создание, обучение и ведение своих собственных нейросетей?

Траты корпораций на создание, обучение и ведение собственных нейросетей могут значительно варьироваться в зависимости от множества факторов, таких как:

1. Размеры и сложность моделей. Большие и продвинутые модели типа GPT-4 или DALL-E нуждаются в мощных компьютерах и много времени для тренировки.

Например, чтобы натренировать GPT-3, понадобилось примерно столько вычислений, будто бы одновременно работали 1000 специальных видеокарт целый месяц. Создание таких моделей требует больших денег на технику и электричество.

2. Количество данных. Чем больше данных используют для обучения, тем сильнее нужны мощные компьютеры и хранилища. Например, для тренировки GPT-3 было использовано почти 570 гигабайт текста, что требует сильных серверов и вместительных дисков.

3. Инфраструктура. Выбор между арендой мощностей в облаке (например, Amazon Web Services, Google Cloud или Microsoft Azure) или созданием своего собственного центра обработки данных тоже сильно влияет на расходы. Хотя облака предлагают огромные мощности, их аренда стоит немало. Если строить собственный центр, то придется вложить крупную сумму сразу и постоянно тратить деньги на поддержание его работы.

4. Человеческий труд. Сюда входят зарплаты экспертов по искусственному интеллекту, аналитиков данных и других нужных работников. Люди, занимающиеся разработкой нейросетей, получают высокую зарплату. К примеру, в Америке специалисты по машинному обучению зарабатывают от 5 тысяч до 20 тысяч долларов ежемесячно, но это зависит от опыта человека и места проживания.

5. Время обучения. Обучение больших моделей может занимать недели или даже месяцы. Обучение больших моделей может занимать недели или даже месяцы. Например, обучение GPT-3 заняло несколько месяцев.

Примерные затраты:

1. Google: В 2023 году Google потратила около $26 миллиардов на исследования и разработки, включая работу над нейросетями. Google тратит значительные суммы на исследования и разработки. Однако точная сумма, потраченная на нейросети, скорее всего недоступна на самом деле публике, так как компании не всегда с радостью раскрывает эту информацию для изучения ее своим конкурентам.

2. Microsoft: В 2023 году Microsoft инвестировала около $20 миллиардов в исследования и разработки, включая работу над нейросетями. Тоже точная сумма будет вряд ли нам доступна. Можем только лишь предполагать.

3. Amazon: В 2023 году Amazon потратила около $42 миллиардов на исследования и разработки, включая работу над нейросетями. Огромные деньжища! Кто его знает, на что они вообще их там тратили!

Эти цифры включают не только затраты на нейросети, но и на другие исследования и разработки. Точные цифры по затратам на нейросети могут быть недоступны, так как компании не всегда раскрывают эту информацию. Все это лишь для того, чтобы мы с вами могли представить, какие траты для подобной инфраструктуры нужны компаниям и какую прибыль они собираются от этих ресурсов получить при использовании этих невероятно дорогущих мощностей!

Список самых популярных, как кажется автору, нейросетей на весну 2025 года:

– ChatGPT – всем известный чат-бот, который выглядит как текстовый диалог с реальным человеком;

– Gemini – работает с текстом, видео, изображениями, звуком;

– YandexGPT – может вести диалоги, писать простой код, создавать текстовый контент, переводить тексты;

– Midjourney – создает изображения из текстовых описаний;

– Stable Diffusion – позволяет генерировать изображения на основе текстового запроса, а также дорисовывать наброски и редактировать исходные картинки;

– DALL-E 3 – модель генерации изображений по текстовому описанию;

– Шедеврум – умеет генерировать текст, изображения и видео на основе запросов пользователей. Очень похожа на соцсеть, где пользователи могут общаться и обсуждать свои генерации;

– Kandinsky 3.0 – способна создавать реалистичные изображения и видео на русском языке;

– Suno – генеративная модель машинного обучения, с помощью которой можно создавать музыку, не владея нотной грамотой и игрой на музыкальных инструментах;

– Copilot – умный помощник от Microsoft, который может выполнять различные задачи;

– Manus AI – универсальный агент искусственного интеллекта, который спроектирован так, чтобы быть полностью автономным, что означает, что он может превращать человеческие мысли в действия, планируя и выполняя сложные задачи реального мира самостоятельно, без постоянного контроля человека;

– Flux – нейросеть для генерации картинок по текстовому запросу. Высокая фотореалистичность;

– Pika – платформа для создания видео на основе искусственного интеллекта, которая позволяет пользователям генерировать и редактировать видео с помощью текстовых подсказок, изображений и продвинутых функций;

– Kling – платформа генерации видео с использованием искусственного интеллекта Kuaishou;

– Claude – чат-бот на основе искусственного интеллекта, созданный компанией Anthropic;

– Luma – специализируется на создании высококачественных, реалистичных 3D-изображений, видео и игровых ресурсов;

– RunWay – позволяет генерировать и редактировать видео, фотографии и аудио;

– Hailuo – создает короткие видеоролики с нуля по текстовому запросу, оживляет картинки и делает дипфейки. Бонусом – генерирует и озвучивает тексты;

– DeepSeek – большая языковая модель с открытым исходным кодом. Аналогия Chatgpt от китайского разработчика;

– Qwen – целое семейство больших языковых моделей, разработанных Alibaba;

– Perplexity – поисковая система и чат-бот на базе искусственного интеллекта;

– Hedra – пользователи могут начать либо с генерации аудио из текста, либо с загрузки собственного аудио. Затем они создают или загружают изображение персонажа, которое может быть фотографией, изображением, сгенерированным искусственным интеллектом, или текстово-графическим созданием. Искусственный интеллект Hedra затем анимирует персонажа, синхронизируя движения губ, выражения лица и движения тела с аудио;

– Gigachat – нейросетевая модель искусственного интеллекта, созданная Сбером в 2023 году. Он способен отвечать на вопросы, решать задачи, помогать с анализом текстов и математическими расчетами. GigaChat поддерживает работу с текстом и обладает дополнительными навыками, такими как генерация изображений и видео;

– leonardo.ai – позволяет создавать изображения, анимации, арт-объекты и текстуры;

– ideogram.ai – сервис для генерации изображений с использованием искусственного интеллекта. Он позволяет интегрировать текст визуально в составе изображений. Бомбические изображения, в которые можно сгенерировать отличный красивый текст (а не абракадабру, как обычно получается у нейросетей);

– Websim.ai – генерация веб-приложений на основе HTML, CSS и JavaScript. Тут мы можем с помощью обычного текста и своей обычной фантазии сделать полноценную компьютерную игру или свой целый сайт. Doom или тапалка хомяка совершенно без знания кода и программирования. С первого раза не получится что-то нормальное. Но с двадцатой попытки у вас начнет получаться;

– Codeium – набор инструментов на основе искусственного интеллекта для разработчиков. Он помогает писать код быстрее и эффективнее;

– Mistral – умеет искать информацию в интернете с указанием источников, аналогично ChatGPT от OpenAI. Также позволяет модифицировать, преобразовывать или редактировать контент, например, макеты веб-страниц и визуализации данных;

– Pixverse Ai – позволяет создавать видео из текста и изображений;

– Llama – распознает 30 языков, генерирует тексты и может управлять умным домом. Умеет генерировать изображения по запросу, обрабатывать фото, видео- и аудиоконтент;

– RedGPT – поиск популярных постов в указанном субреддите и генерация ответа на самый последний пост, который соответствует запросу. Генерация ответа, если в субреддите есть пост, соответствующий запросу. Если таких постов не найдено, RedGPT выходит без генерации ответа;

– Notebooklm – от Google, анализирует документы, сайты, YouTube-ролики и делает методички или необходимые выборки согласно этим данным. Но главная фича: можно сделать полноценный подкаст из всех этих файлов, где два ИИ голосом будут общаться между собой на основе ваших загруженных документов.

Зачем этот список вообще вам тут?

1. Удобство доступа. Открыли книгу и посмотрели, чего вам может помочь «здесь и сейчас».

2. Экономия времени. Вместо того, чтобы тратить время на поиски, вы можете сразу получить список популярных нейросетей с описаниями.

3. Новые возможности. Многие могут не знать обо всех существующих нейросетях и их возможностях. Такой список поможет открыть новые инструменты для творчества, работы или учебы.

Несколько книг про нейросети, которые автор читал сам и вдохновился их описанием:

1. «Распределенный искусственный интеллект» Душкина Романа Викторовича

Краткое о книге: поймете, как искусственный интеллект становится основой современной жизни – от крошечных роботов в медицине до космических компьютерных сетей. Вы изучите принципы построения и работы нейросетей, а также загляните в будущее: познакомитесь с квантовыми технологиями, системами искусственного интеллекта на блокчейне и возможностями объединения человеческого разума с компьютером.

2. «Искуственный интеллект и нейросети: практика применения в рекламе» В. А. Евстафьева, М. А. Тюкова

Кратко о книге: показывает на множестве примеров, как создавать тексты, картинки и рекламные материалы с помощью нейросетей, внедрять искусственный интеллект в образование, учить нейросети новым задачам и другим интересным вещам. Все подробно показано и наглядно пояснено иллюстрациями. Богато иллюстрированно, я даже бы сказал.

3. «Как учится машина» Яна Лекуна

Кратко о книге: автор книги – один из создателей метода глубокого обучения, используемого в искусственных нейронных сетях, работающих подобно человеческому мозгу. Автор честно и понятно рассказывает о своем научном подходе, объединяя компьютерные науки и исследования мозга, освещая возможные пути развития искусственного интеллекта, возникающие трудности и будущие возможности.

4. «Занимательная манга. Машинное обучение» Масахиро Араки

Кратко о книге: вместе с персонажами комикса читатели легко разберутся, что значит «регрессия» и как делить данные на группы, поймут, как правильно проверять точность моделей и как работают нейронные сети. В конце рассказано, как обучать модели без заранее известных правильных ответов. Эта книга подойдет начинающим специалистам по машинному обучению, знакомым с университетской математикой первого-второго курса.

Это все совсем не является рекламой! Исключительно опыт автора! Считаю важным правилом: если вам первые 25 страниц чтения книга не нравится – не читайте ее совсем! Вряд ли она вам понравится и дальше! Эти же книги я прочитал от корки до корки. А про нейросети и искуственный интеллект я ох как не мало книг прочитал.

Скажу кратко к завершению этой главы: книги – маст хэв к прочтению! В книгах и практике находится все таинство истинных знаний о нейросетях!

Помните об этом.

Глава 2: Про нейросети
для текста

Что такое промпты

Промпт, промт, промтинг, инструкции, заклинания, чары, описания, промт инжиниринг – да какая на самом деле разница? Главное чтобы это работало! Называйте молоток хоть «тетей Валей»! Главное чтобы молоток забивал гвозди и выполнял свои задачи!

Важно понимать, что мы даем нейросети запрос – она выдает нам ответ из своих обученных данных.

Нейросеть в первую очередь для нас – машина. Самый настоящий компьютер, который лучше всего понимает цифры. Значения математические.

Эта машина нейросетевая – не видит, не слышит, не имеет опыта от рождения, не предугадывает и не догадывается самостоятельно. Кто бы что ни говорил. В первую очередь нужно понять для себя именно это. У нее нет ни ушей, ни нюха, ни глаз! Нет у нее целостного жизненного опыта. Она не может подстроиться под ваше мировозрение. Или ваше ощущение мира. Она выдаст вам данные, которыми обладает сама. На которых обучалась до знакомства с вами. И только.

Если мы скажем нейросети рассказать нам о автомобиле, ей придется перебрать сотни тысяч видов автомобилей! Сопоставить их друг с другом! Найти все возможные сходства! И только после этого дать нам общий и короткий ответ. Самая настоящая сила тех самых пер-цеп-тронов!

Представляете это себе?

Все потому, что она даже не представляет, где этот автомобиль ваш находится, кто его изобрел, какой автомобиль вам нужен, какой у него цвет, как и почему он вообще работает и для чего вообще этот автомобиль людям понадобился. Нейросеть об этом ничего не знает, пока вы ее об этом не попросите. Помните, мы в самом начале с вами говорили о весах? Это то самое, да. И вот когда мы не даем направление на эти весы, мы получаем что-то общее между всеми самыми разными весами.

И именно поэтому очень важен подход индивидуального промтинга для современных нейросетей. Чем углубленнее и качественнее мы пишем инструкции для нейросетей, тем лучше получаются у нейросетей результаты.

Нейросетям не нужно ничего понимать, ощущать или улучшать, пока мы их этого не попросим. И тут как раз имеется интересный факт: главная слабость у нейросетей – незавершенность поставленной задачи. Если бы у них были эмоции – вы не представляете, как бы сильно их бесила незавершенность процесса.

Слава богу, с современными моделями сейчас все очень просто, и они невероятно мощные! Пару предложений написал, и они нам выдали максимально приближенный результат, который мы хотим. Ранее нужно было целую главу для книги написать с черточками и кавычками, чтобы получить действительно стоящий результат от нейросетей.

Теперь мы просто можем написать пару-тройку предложений и уже получим весьма качественные результаты. Программисты следующую аналогию, думаю, поймут: с ассемблера мы наконец пришли к питону! Но сложности все равно остались и приходится иногда писать ручками!

Также стоить учесть, что нейросети не знают наших предпочтений, если мы им об этом не скажем.

Представьте, что вы пришли в ресторан, а там меню – это нейросеть. Вы заказываете блюдо, и оно появляется на вашем столе. Только вот если вы скажете официанту: «Принесите мне еду», – вам принесут что угодно. Может, суп, может, стейк, а может, и тарелку пустую. А если вы конкретно скажете: «Хочу борщ с пампушками», – вот тогда все станет намного вкуснее и понятнее.

Еще проще:

1. Допустим, вы попросите нейросеть нарисовать вам вашу любимую машину с вашим любимым цветом. Вы подумаете, что нейросеть нарисует вам красную феррари. А по факту вы получите коричневый пежо. Почему? Потому что она просто не знает ваших вкусов и предпочтений.

2. Попросите нейросеть сгенерировать вам вкусные напитки, а окажется, что вы их вообще терпеть не можете. Ведь вкусы для всех людей очень разные. И если что-то нравится вам, это не значит, что это обязано радовать остальных. А нейросеть тем более не знает, как вы выглядите! Какой у вас голос и в каком регионе живете! Куда там до вкусов!

3. Хотите получить совет от нейросетей, но она выдает какие-то расплывчатые, общепризнанные и всем известные слова об этом? И снова по тем же причинам – нужно больше деталей и больше вводных данных. Как о вас, так и о ситуации с причинами. И чем подробнее, тем лучше.

Именно поэтому промты для нейросетей имеют огромнейшее значение. Нейросети в первую очередь общаются с поступающими данными из компьютера и ваших мобильных устройств. А не прямо из вашего мозга и мыслительных процессов. Ваши образы куда масштабнее и сложнее, чем вы привыкли их воспринимать сами.

Используя подробные и грамотные инструкции на основе логики для генерации нейросетей, мы помогаем им понять, что действительно нам необходимо и какой результат мы хотим получить.

Так что же такое эти ваши промпты?

Представь себе, что ты играешь с игрушкой, например, с умным роботом, который собирает твой конструктор! Ты даешь роботу задание собрать что-то конкретное, и он начинает строить именно то, что ты попросил. Все это выглядит примерно так.

Промпт – это команда или вопрос, который ты задаешь нейросетям, чтобы получить от них какой-нибудь результат.

Теперь давай разберемся, откуда вообще взялись эти промпты. Все началось с развития технологий обработки языка. Представим, что сначала были примитивные чат-боты, которые могли только отвечать на самые простые вопросы. Потом появились более продвинутые системы, способные понимать сложные запросы. И вот тут-то и пригодились промпты. Люди начали вводить конкретные команды, чтобы получить нужный результат. Это было удобно и эффективно.

Слово «промпт» происходит от английского «prompt», что означает «подсказка» или «намек». В контексте работы с нейросетями промпты стали называть так, потому что они действительно служат своеобразной подсказкой или стартовым сигналом для системы. Когда ты вводишь промпт, ты как бы намекаешь нейросети, что именно ты хочешь увидеть или узнать. Это похоже на то, как если бы ты давал другу идею для шутки или истории, а он развивал ее дальше.

Название «промпт» хорошо отражает суть процесса: ты даешь начальную информацию, а нейросеть на ее основе генерирует что-то новое. Эта аналогия с подсказкой делает взаимодействие с искусственным интеллектом более понятным и естественным.

Как это работает на простом примере:

1. Давай попросим нейросеть нарисовать кота. Ты говоришь: «Нарисуй кота, который играет с клубком ниток». Это твой промпт! Ты дал команду, и теперь нейросеть начнет рисовать картинку с котиком.

2. Что еще можно попросить? Например, ты можешь сказать: «Напиши сказку про волшебный лес с котиком, который играет с клубком ниток». Или: «Подскажи, как сделать пирог с изображением котика, который играет с клубком ниток».

3. Однако, как мы говорили ранее, важно точно описать, что ты хочешь. Если ты скажешь просто: «Кот», – получится любой кот. А вот если добавить подробности, как мы сделали раньше (кот + клубок ниток), картинка будет с дополнением клубка ниток.

4. Нейросеть отвечает на твои запросы. Она думает над твоими словами и пытается сделать все, как ты просил. Но иногда она может немного запутаться, особенно если твоя просьба была сложной или непонятной.

5. Важно поэтапно давать задачи нейросети, сделать ей задачу списком и по пунктам. Либо раскачивая ее, постоянно дополняя новыми параметрами полученные результаты от нее.

Почему это важно?

Промпт помогает тебе получать нужные результаты. Чем лучше ты объясняешь, что хочешь, тем точнее получается ответ. Это как с друзьями: если ты четко говоришь, что тебе нужно, друг быстрее поймет тебя и поможет.

Конец ознакомительного фрагмента.

Текст предоставлен ООО «Литрес».

Прочитайте эту книгу целиком, купив полную легальную версию на Литрес.

Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.

<1 2 3 4 >

На страницу:

Перейти

3 из 4