ИИ без магии. Искусственный интеллект – про сложное просто

Полная версия

ИИ без магии. Искусственный интеллект – про сложное просто

Name: ИИ без магии. Искусственный интеллект – про сложное просто
Rating: 3 (42 reviews)
Author: Галя Дмитриева
ISBN: 9785006909557

текст

Галя Дмитриева

Жанр: техническая литература книги о компьютерах публицистика

Язык: Русский

Год издания: 2026

Добавлена: 28.01.26

О книге

Читать онлайн

Настройки чтения

Размер шрифта

Высота строк

Поля

1 2 >

На страницу:

Перейти

1 из 2

ИИ без магии
Искусственный интеллект – про сложное просто

Галя Дмитриева

ISBN 978-5-0069-0955-7

Создано в интеллектуальной издательской системе Ridero

От Автора

Я благодарна своему мужу – он всегда поддерживает меня во всех начинаниях и в любой момент готов ответить на мои вопросы или сделать то, что для меня действительно важно. Именно благодаря встрече с ним я когда-то определилась с выбором профессионального пути – в сторону информационных технологий. В то время у меня было два направления: юридическое и техническое. Технические специальности тогда были совсем «не в моде», и никто не знал, что через несколько лет всё изменится.

Я благодарна своей дочери – она для меня и друг, и мотиватор. Её слова: «Мама, ты такая молодец» – всегда вдохновляют и придают сил. Муж и дочь – первые читатели моих книг и самые честные рецензенты.

Я благодарна своей маме – за терпение, поддержку и за тот фундамент, на котором я смогла выстроить свою жизнь, мышление и отношение к делам.

Я благодарна своему внуку – за радость, которую он просто приносит своим присутствием, и за множество вопросов «а почему?» и «а зачем?», которые каждый раз напоминают, которые каждый раз напоминают, как важно сохранять любопытство к миру и уметь объяснять сложное просто.

Я благодарна своим друзьям и единомышленникам – за разговоры, идеи, поддержку и ощущение, что рядом есть люди, с которыми можно думать, сомневаться и расти.

Сюжет книги основан на реальных событиях.

Глава 1. Маша хочет узнать, что такое искусственный интеллект

– Привет! – кричала Машка. – Мне срочно нужно к тебе приехать!

– Что случилось? – удивилась я.

– Хочу, чтобы ты рассказала мне всё про искусственный интеллект!

Через полчаса Маша уже сидела у меня на террасе с кружкой ароматного кофе.

– Я готова, – сказала она. – Только помедленнее, пожалуйста. Ты же программист.

Маша всегда произносила эту фразу с особым выражением – «тыжепрограммист» – когда хотела, чтобы я перевела что-то сложное с технического языка на человеческий.

– Окей, Маш. Под «искусственным интеллектом» ты имеешь в виду чаты, генерацию картинок, текстов, всю эту «магию», верно?

– Ага, – кивнула она.

– Отлично, тогда начнём с главного.

Искусственный интеллект, или ИИ (AI – Artificial Intelligence), – это общее название для разных методов и технологий, с помощью которых компьютер имитирует интеллектуальную деятельность человека, то есть выполняет то, что раньше считалось исключительно «умением человека».

– Разве это новое? – нахмурилась Маша.

– На самом деле нет. Ты пользуешься ИИ уже давно. Просто раньше он был незаметным. Например, когда поисковик понимает твой запрос и предлагает лучшие варианты – это ИИ. Когда навигатор на карте прогнозирует трафик и рассчитывает оптимальный маршрут – это ИИ. Когда камера в смартфоне автоматически улучшает фото – тоже ИИ. Когда рекомендации показывают фильмы, музыку, рецепты – ИИ работает в фоне.

– Подожди… – Маша подняла брови. – «Найди кафе рядом» – это тоже ИИ?

– Конечно. Система анализирует локацию, отзывы, рейтинг, твои прошлые предпочтения – и выбирает, что тебе подойдёт. Это не просто поиск, это уже интеллектуальная фильтрация.

– А голосовые помощники? Типа Алисы или Сири? Они шутят и рассказы придумывают.

– Разумеется. Они распознают твою речь, интерпретируют смысл и генерируют ответ. Иногда кажется, что они «думают», но внутри – математика и огромные модели.

Маша задумчиво повела пальцем по кружке:

– Получается, я живу с ИИ уже давно… и даже не замечала, а обратила внимание на него только когда все стали об этом говорить?

– Именно. Ты давно с ним взаимодействуешь – просто раньше это выглядело как удобные функции, а не как «большой умный собеседник». Сейчас ИИ стал заметным, потому что мы можем разговаривать с ним напрямую.

– Да уж…

– ИИ – это не робот с глазами, а программа. Программа, у которой вместо глаз – цифры, вместо мозга – математика, а вместо памяти – огромные массивы данных.

Маша рассмеялась:

– Тогда я его уже люблю. Но я хочу понять его по-настоящему. Слова «нейросеть», «модель», «агент», «чат»… Для меня это всё одно и то же!

– Понимаю, – улыбнулась я. – Давай разберёмся.

Глава 2. Давай разберёмся кто есть кто в мире ИИ

– Представь, что мы пришли в кафе, – продолжила я. В нём есть хозяин, повар, официант и меню. Так вот, в мире ИИ всё примерно так же, только роли немного другие.

ИИ – это общая идея, широкое направление. Как слово «кухня».

Внутри этой кухни есть рецепты, повара, блюда – и всё вместе называется «кухней».

– То есть ИИ – это как целая область?

– Да. ИИ – это широкое понятие: область, направление, цель – создать системы, которые выполняют интеллектуальные задачи. Нейросеть – один из технических способов реализации ИИ. Но ИИ не обязательно реализуется через нейросети.

– Нейросеть – это математическая модель, имитирующая отдельные принципы работы человеческого мозга, где решение рождается из взаимодействия множества связанных между собой элементов, а не из заранее прописанных правил.

Сама по себе она ничего не делает – ей нужен запрос. Она похожа на профессионального повара на кухне без заказов: все навыки есть, но действие начинается только после запроса.

Модель – это нейросеть после обучения. Это та же нейросеть, но обученная на данных, с весами и параметрами, которые позволяют ей что-то делать: писать тексты, распознавать речь, генерировать картинки.

Как повар, который уже прошёл курсы, отработал рецепты и теперь знает, что и как готовить.

– А-а-а, то есть модель – это «готовая к работе нейросеть»?

– Умница. Например, GPT-4, Gemini 1.5, Claude 3 – это модели.

Они уже умеют говорить, рассуждать, писать тексты. А чат – это просто упаковка, интерфейс, приложение, где ты можешь общаться с моделью.

– То есть «чат» – это не модель?

– Нет! Но очень многие путают.

Например, ChatGPT – это чат. А модель внутри него – GPT-4.

– Как ресторан и повар?

– Именно! Чат – это ресторан, где ты сидишь за столом и тебе подают блюда. Модель – повар на кухне.

– А ИИ-агент?

– Ну а ИИ-агент – это уже другой уровень. Это модель + инструменты + возможность действовать.

– Действовать?

– Да. Не просто отвечать в чате, а пользоваться внешними сервисами, что-то искать, открывать файлы, планировать, выполнять команды.

– То есть агент – это как официант, который не только приносит блюдо, но и может сбегать в магазин, если продукта нет?

– Прекрасно! Модель – мозг. Чат – интерфейс. Агент – модель, которой дали руки и ноги.

В своём блокноте Маша записала:

1. Искусственный интеллект – это вся область, огромный мир.

2. Нейросеть – технология внутри этого мира.

3. Модель – обученная нейросеть, которая уже умеет что-то делать.

4. Чат – приложение, через которое можно общаться с этой моделью.

5. ИИ-агент – модель, которой дали инструменты и возможность выполнять действия.

– То есть, когда я говорю: «Я поговорила с нейросетью», я чаще всего имею в виду «с моделью внутри чата»?

– Да. А когда говоришь «ИИ» – обычно имеешь в виду всё сразу, целую кухню – область.

– Хорошо. А теперь объясни мне, что происходит внутри модели.

– Тогда поехали глубже, – улыбнулась я. – Разберём, как это работает изнутри на примере GPT.

Глава 3. Что такое нейросеть и как устроен ChatGPT

– Компания OpenAI разработала языковую модель GPT (Generative Pre-trained Transformer) и на её основе создала сервис – чат ChatGPT, – начала я. – Другие компании тоже создают собственные модели искусственного интеллекта. Например, Google и Яндекс тоже разработали свои ИИ-модели.

Нейросеть – это математическая структура, состоящая из множества связанных между собой вычислительных узлов – нейронов. Каждый узел получает числовые входы, преобразует их с помощью простой функции и передаёт результат дальше.

По сути, нейросеть – это сложная функция с огромным количеством параметров (весов), которые модель «выучивает» в процессе обучения.

– Ты что! – Маша закричала так пронзительно, что почти перешла на визг. Так она делает всегда, когда возмущена или ничего не понимает. – Думаешь, я это поняла? Давай по-простому. Нейросеть – это как мозг у компьютера, верно?

– Почти. Нейросеть – это математическая модель, собранная из множества простых компонентов. Но вместе они создают сложное поведение, взаимодействуя между собой. Архитектуру этой системы придумывают разработчики, а «знания» она получает во время обучения – на миллиардах текстов.

– Архитектура – это как?

– Как у дома: есть фундамент, стены, перекрытия.

У нейросети есть слои и нейроны, связанные между собой параметрами – числовыми настройками, которые определяют, как именно модель будет обрабатывать текст.

– А что происходит, когда я пишу в ChatGPT? Я общаюсь с… математикой?

– С математической моделью. ChatGPT – это языковая математическая модель. Она построена на нейросети и умеет анализировать текст и предсказывать, какое слово должно быть следующим.

Глава 4. Как она это делает? Как нейросеть генерирует ответы

– Как она это делает? «Как она генерирует ответы?» – спросила Маша.

– Ты вводишь текст. Например: «Расскажи про кошек».

– Текст разбивается на токены.

– Токены – это слова, фразы или части слов. Например: «рас», «скажи», «про», «ко», «шек».

– Каждому токену соответствует число.

– Это уникальный цифровой идентификатор из словаря модели.

– Эти числа проходят через нейросеть слой за слоем.

– Параметры рассчитывают вероятности следующего слова, определяют, какое слово должно быть следующим.

– Числа снова превращаются в текст, и ты видишь слова.

В итоге модель возвращает тебе уже готовый текст в привычном для нас виде.

– А эти параметры… они важные?

– Очень. Количество параметров – это как мощность интеллекта, условный IQ. Чем больше параметров, тем сложнее и «умнее» модель. GPT- 4 имеет сотни миллиардов таких параметров.

– То есть модель не ищет готовый текст?

– Нет. Она не читает Википедию и не лезет в Google. Она каждый раз заново вычисляет ответ, шаг за шагом.

Маша задумчиво повертела ложку:

– Получается, она не знает, как человек…

– Именно. Но она настолько хорошо обучена, что её ответы выглядят как знание.

– И всё это – просто числа?

– Да. Числа, параметры и миллиарды вычислений на серверах.

– Обалдеть… – выдохнула Маша.

Глава 5. ChatGPT точно не лезет в Википедию или Google?

– Слушай, а ChatGPT точно не лезет в Википедию или Google? У меня было ощущение, что он что-то оттуда берёт, – сказала Машка, нахмурившись.

– Понимаю, почему тебе так кажется. На самом деле всё зависит от версии и от того, в каком режиме ты с ним общаешься, – ответила я.

– В обычном режиме ChatGPT сам по себе в интернет не ходит. Он обучен на заранее собранной выборке текстов: книгах, статьях, сайтах – в том числе частично и Википедии. Но после обучения его знания не обновляются в реальном времени.

Это как если бы ты прочитала кучу энциклопедий, условно, в 2025 году – и теперь отвечаешь по памяти.

– Но иногда он всё-таки может обращаться к интернету?

– Может – если его встроили в систему с доступом к сети.

Например, в некоторых версиях ChatGPT есть режим с доступом к интернету. В этом случае модель может читать сайты и использовать свежую информацию для ответа.

То же самое касается ботов, встроенных в сайты, поисковики или корпоративные системы. Если им дали доступ к внешним источникам, модель может их использовать.

Но важно понимать: ChatGPT – это не поисковик. Он не ищет готовые ответы в Википедии и не копирует оттуда куски текста. Он работает по-другому. Давай повторю коротко:

• ты задаёшь вопрос;

• модель превращает текст в токены – числа;

• использует параметры, чтобы предсказать ответ, похожий на то, что она «видела» во время обучени;

• и только если доступ к интернету разрешён, может дополнительно уточнить или проверить информацию через поиск.

Маша кивнула:

– Получается, ChatGPT может использовать интернет, если ему это разрешили.

– Именно. Но даже в этом случае он всё равно «думает» по-своему – на основе статистики и параметров. Он не просто ищет. Он вычисляет и предсказывает наиболее вероятное продолжение.

А поиск в интернете – это всего лишь способ сделать эти «предсказания» более актуальными.

Глава 6. Как ИИ (AI) учится и чем отличается AGI

Маша делала записи в блокноте и одновременно щёлкала ручкой.

– Ладно, допустим. Нейросеть – это математическая модель, состоящая из слоёв и функций с параметрами. Но как она учится? Кто её учит? Программисты?

Я улыбнулась:

– Хороший вопрос. Программисты не «учат» её каждой конкретной фразе. Они создают форму нейросети, общие правила работы, – а уже дальше начинается этап обучения.

– Это как? Ей показывают учебники?

– Почти. Для обучения используют огромные текстовые массивы – книги, статьи, сайты, форумы, – представленные в виде чисел (токенов).

А дальше Модель тренируется на задаче предсказания следующего элемента.

– В смысле?

– Например, ей дают фразу:

«Кошка сидит на…»

И просят предсказать, какое слово должно быть следующим. Допустим, «подоконнике».

Модель делает предположение. Потом её ответ сравнивают с правильным вариантом из обучающих данных. Если она ошиблась, специальный алгоритм обучения автоматически корректирует параметры – веса нейросети, – чтобы в следующий раз вероятность правильного ответа была выше.

– То есть ей говорят: «Неправильно, попробуй ещё раз»?

– По сути – да. Только вместо слов используются числа и формулы.

– И так миллионы раз?

– Миллиарды.

Машка вздохнула.

– А расскажи мне про AGI (Artificial General Intelligence). Про самые «умные ИИ», которые умеют всё. Это же что-то другое?

– Да, и тут как раз появляется важное различие между AI и AGI.

Я сделала глоток кофе и продолжила:

– AI (Artificial Intelligence) – это искусственный интеллект, который хорошо решает конкретные задачи: распознаёт текст, пишет стихи, рисует картинки, управляет машиной, играет в шахматы. Он как узкий специалист.

– AGI (Artificial General Intelligence) – это общий искусственный интеллект. Теоретически он должен уметь рассуждать, обучаться новому, адаптироваться к незнакомым ситуациям, переносить знания между разными областями – примерно как человек.

– То есть GPT – это ещё не AGI?

– Пока нет. GPT – это языковая модель. Она отлично работает с текстом, но остаётся специализированной системой. У неё нет сознания, собственных целей или настоящего понимания мира. Она просто очень хорошо предсказывает, какой ответ будет наиболее уместным в данном контексте.

– Но ведь есть разные модели?

– Конечно. Одна генерирует изображения – например, DALL-E. Другая – музыку. Третья – ещё какие-то действия. У каждого своя задача и своя специализация.

– То есть у всех моделей (коротко – ИИ) разная «профессия»?

– Именно. ChatGPT – мастер работы с языком. Он не «понимает» музыку или видео, как человек, но отлично пишет, объясняет, резюмирует и рассуждает в текстовой форме. Его сила – язык.

– А можно вообще создать AGI, который умеет всё?

– В теории – да. На практике – это всё ещё открытая задача. Уже существуют мультимодальные модели, которые работают с текстом, изображениями, аудио и видео через дополнительные компоненты.

– Но настоящий AGI – это следующий уровень. Он должен уметь самостоятельно осваивать новые области, обобщать знания и адаптироваться к принципиально новым задачам – без пошаговых инструкций от человека.

Маша на секунду замолчала.

– Знаешь… я и не думала, что у ИИ столько уровней.

Она открыла новую страницу в блокноте и что-то записала.

– Всё. Я готова к следующему уроку. Что дальше?

Глава 7. Архитектура нейросети. Трансформеры. Что такое Self-attention

– Архитектура нейросети построена на технологии трансформеры – начала я. Трансформер – это не отдельная программа, не база знаний и не алгоритм в классическом смысле, а схема обработки информации. Это способ научить нейросеть понимать и обрабатывать язык целиком, а не по кусочкам.

Раньше нейросети читали текст строго по порядку: слово за словом. Это было медленно и плохо работало с длинными текстами. Трансформеры изменили подход.

– Представь, что ты читаешь предложение, – продолжила я. – Ты не ждёшь конца, чтобы понять начало. Ты держишь в голове весь смысл сразу.

Трансформер делает примерно то же самое – обрабатывает последовательность параллельно:

• смотрит на все слова одновременно;

• понимает, какие слова важны друг для друга;

• учитывает контекст целого предложения или абзаца.

– То есть он не просто идёт слева направо?

– Именно. Он работает с текстом как с системой связей.

– Внутри трансформера есть механизм, который называется self-attention – «само-внимание».

– О, вот это слово я уже слышала, – оживилась Маша.

– Это ключевая идея. Self-attention позволяет модели определить, на какие слова стоит обратить внимание, когда она обрабатывает конкретное слово (вычисляет веса влияния токенов друг на друга).

Приведу пример тебе, в предложении «Маша взяла книгу, потому что она была интересной» модель должна понять, что «она» – это книга, а не Маша.

Self-attention помогает установить такие связи.

– То есть модель как будто расставляет акценты?

– Да. Она вычисляет, какие части текста влияют друг на друга сильнее, а какие слабее.

– Именно благодаря трансформерам чаты ИИ:

• понимают длинные диалоги;

• помнят контекст разговора;

• отвечают связно и логично;

• могут рассуждать, объяснять и продолжать мысль.

Без трансформеров ChatGPT был бы медленным и плохо понимающим длинные вопросы.

– А трансформер – это и есть GPT?

– Нет. GPT – это модель, построенная на архитектуре трансформера. Как дом:

• архитектура – это проект,

• модель – конкретный построенный дом,

• обучение – это то, чем его наполнили.

Трансформеры – это прорыв. Сегодня они используются не только в чатах, но и:

• в переводчиках;

• в генерации изображений;

• в анализе видео;

• в работе с кодом;

• в поиске и рекомендациях.

Маша нахмурилась:

– То есть трансформер понимает?

Я покачала головой:

– Он моделирует понимание, но не осознаёт смысл, как человек.

Трансформер:

• работает с вероятностями;

• ищет закономерности;

• предсказывает продолжение.

Он не знает, что такое книга или кофе. Он знает, как слова обычно связаны друг с другом.

– И делает это чертовски убедительно.

– Именно.

Я заглянула в Машин блокнот, где она записала:

1. Трансформер – это архитектура нейросети;

2. Он обрабатывает текст целиком, а не по одному слову;

3. Основан на механизме self-attention;

4. Трансформеры лежат в основе ChatGPT и других чатов ИИ;

5. GPT – это модель, построенная на архитектуре трансформера.

Глава 8. Как спрашивать у ИИ. Что такое промпт (prompt)

– А что такое промпт? – спросила Маша, помешивая кофе.

– Промпт – это запрос или инструкция для модели. Всё, что ты пишешь в чат, – это и есть промпт.

– Даже просто вопрос?

– Даже самый простой. Вот ты сейчас спросила меня – это тоже промпт.

По сути, промпт – это формулировка задачи для модели, или ИИ. Все-таки чаще всего используется этот общий термин. Я сделала паузу и добавила:

– Представь, что ты объясняешь задание человеку. Если скажешь что-то размытое – результат будет таким же. А если чётко объяснишь, что хочешь получить, в каком виде и для кого, – ответ будет намного лучше.

– То есть промпт – это способ управлять тем, как ИИ отвечает?

– Именно. Хорошо сформулированный промпт помогает:

• получить более точный и полезный результат;

• задать стиль и тон ответа – серьёзный, дружелюбный, простой;

• указать формат: список, план, объяснение, текст;

• подсказать уровень сложности – «простыми словами» или «для специалиста».

– А если я просто напишу одно предложение?

– Этого уже достаточно. Но чем больше контекста ты даёшь, тем легче ИИ тебя понять. Он не читает мысли – он работает только с тем, что ты написал.

– Какой моделью ты обычно пользуешься? – спросила Маша и приготовилась записывать.

– Я применяю ИИ чаще для работы с аналитическими текстами, поэтому в основном использую:

• Deepseek (https://chat.deepseek.com),

• Qwen (https:// chat.qwen.ai),

• GhatCPT (https://chatgpt.com).

Заходишь по ссылке, регистрируешься – вводишь логин и пароль. В некоторых чатах можно без регистрации, но тогда твои истории общения в чате не будут сохраняться. Так выглядит вход в Deepseek.

Скриншот страницы регистрации DeepSeek

– Запросы (промпты) могут выглядеть по-разному:

• «Объясни, что такое второй закон Ньютона простыми словами, как для ученика 7 класса»;

• «Составь план маркетинговой кампании для онлайн-школы английского языка»;

• «Переведи этот текст на испанский язык»;

• «Представь, что ты диетолог. Дай совет по питанию для человека, который хочет сбросить вес с 90 кг до 75».

– И всё это – промпты? – уточнила Маша.

– Да. Вопросы, просьбы, инструкции – всё это формы одного и того же: разговора с ИИ.

Маша кивнула, задумалась и вдруг вскочила:

– Всё, я поняла! Но я опаздываю в сад за Максимкой!

Она махнула рукой и убежала, а я осталась с мыслью, что самое важное она уже уловила:

ИИ отвечает ровно настолько хорошо, насколько хорошо ты умеешь спрашивать.

Глава 9. Как правильно общаться с нейросетью – промпты с характером

На следующий день мы с Машей уже с утра сидели в кафе и обсуждали, почему одни промпты дают точные и внятные ответы, а другие – сплошную «воду».

– Слушай, – сказала Маша, – а я вот наткнулась на информацию, что бывают разные типы промптов: системные, контекстные, ролевые.

– Так и есть. Эти подходы реально используют – и разработчики, и продвинутые пользователи. У каждого вида промпта – своя задача. Представь, что ты задаёшь модели три слоя инструкций: кто она, в какой ситуации находится и как должна себя вести.

Системный промпт – это базовая установка поведения модели. Она задаётся до начала диалога и действует фоном на всю сессию.

Пример: «Отвечай вежливо, избегай опасных тем, будь полезным, кратким и понятным, приводи примеры».

Системный промпт формирует рамки поведения модели. Он как инструкция: «Вот кто ты, вот как себя ведёшь, вот что приоритетно». Его используют разработчики, чтобы задать общее направление – без него ответы могут быть слишком универсальными или даже сбивчивыми.

В большинстве сервисов (включая ChatGPT) он не виден пользователю, но влияет на все ответы.

Контекстный промпт – это уже твоя часть. Это твой запрос к модели с пояснением – в какой реальности ты находишься и чего хочешь добиться.

«Я – начинающий маркетолог, работаю с новым брендом органического чая. Мне нужно придумать слоган для молодых мам с целью привлечения внимания к бренду».

Такой промпт-контекст помогает модели понять, в какой реальности ты находишься, на каком уровне говорить и чего ты хочешь добиться. Это как рассказать другу, в какой ты ситуации, прежде чем просить совета.

Ролевой промпт

Ролевой промпт задаёт образ или манеру общения.

Примеры:

• «Говори со мной как опытный наставник»;

• «Представь, что ты моя подруга»;

• «Объясняй строго и по делу, как преподаватель».

Он влияет на тональность и подачу, но не является глубинной установкой поведения. Если коротко, то:

• системный промпт – общая рамка поведения (фон);

• контекстный – описание ситуации и задачи;

1 2 >

На страницу:

Перейти