Гений кода. Истории самых впечатляющих ИИ-проектов, которые уже меняют жизнь

Полная версия

Гений кода. Истории самых впечатляющих ИИ-проектов, которые уже меняют жизнь

текст

Дана Матрикс

Жанр: книги о компьютерах

Язык: Русский

Год издания: 2026

Добавлена: 15.05.26

О книге

Читать онлайн

Настройки чтения

Размер шрифта

Высота строк

Поля

<1...4 5 6 7 >

На страницу:

Перейти

6 из 7

Людям показывали запросы и просили написать идеальный ответ. Как должен отвечать вежливый, полезный, безопасный ассистент? Миллионы таких примеров загружали в модель, чтобы она училась подражать человеческому стилю общения.

Шаг 2: Обучение с подкреплением на основе обратной связи (RLHF – Reinforcement Learning from Human Feedback).

Это был гениальный трюк.

Сначала модель генерировала несколько вариантов ответа на один вопрос. Люди оценивали: этот ответ хороший, этот плохой, этот средний. Потом на этих оценках обучали отдельную модель-«критика», которая предсказывала, понравится ли ответ человеку.

А потом основную модель учили так, чтобы она нравилась этому «критику». Это как GAN (глава 10), только вместо критика, который ловит подделки, – критик, который ловит грубость и бесполезность.

В результате получилась модель, которая не только знает, но и умеет себя вести.

Развязка: Диалог, который изменил всё

30 ноября 2022 года пользователи зашли на сайт и начали печатать.

– «Напиши стих про программиста, который влюбился в баги.»

– «Объясни квантовую физику так, чтобы понял пятилетний.»

– «Придумай тост на свадьбу друга.»

– «Помоги мне написать письмо начальнику.»

– «Я грустный, подбодри меня.»

И ChatGPT отвечал. Быстро, связно, полезно, вежливо. Он шутил (иногда смешно), он сочувствовал (иногда трогательно), он объяснял (иногда гениально просто).

Люди не могли поверить. Казалось, что по ту сторону экрана сидит живой человек. Умный, терпеливый, готовый помочь 24/7, бесплатно, без осуждения.

Соцсети взорвались скриншотами диалогов. Люди показывали, как ИИ пишет за них код, как помогает с домашним заданием, как утешает в трудную минуту.

Это был момент, который историк технологий Бенедикт Эванс назвал «моментом Айзека Азимова» – когда фантастика стала реальностью.

Инсайт: Почему сработало именно это

Чем ChatGPT отличался от всех предыдущих чат-ботов?

1. Бесплатно и доступно.

Любой человек с интернетом мог зайти и попробовать. Не нужно было платить, не нужно было разбираться в API, не нужно было читать инструкции.

2. Естественный язык.

Не нужно учить команды. Не нужно писать запросы особым образом. Просто говоришь по-человечески – и получаешь ответ.

3. Универсальность.

Одна модель делала всё: писала код, сочиняла стихи, отвечала на вопросы, переводила, объясняла, советовала. Раньше для каждой задачи был свой инструмент. Теперь один инструмент закрывал 90% потребностей.

4. Персонализация.

ChatGPT помнил контекст разговора. Вы могли обсуждать тему, уточнять детали, возвращаться к предыдущим вопросам. Это создавало иллюзию настоящего диалога.

5. Эмоциональный интеллект.

Модель научилась не просто отвечать, а реагировать на эмоциональное состояние пользователя. Если ты писал грустное сообщение, она отвечала с сочувствием. Если злое – спокойно. Если весёлое – поддерживала игру.

Триумф: Мир после ChatGPT

После 30 ноября 2022 года мир разделился на «до» и «после».

Для обычных людей:

Появился помощник, который всегда под рукой. Школьники перестали писать сочинения сами (к ужасу учителей). Программисты получили шпаргалку по любому языку. Домохозяйки – генератор рецептов. Пенсионеры – собеседника, который не устаёт.

Для бизнеса:

Microsoft вложила в OpenAI миллиарды и встроила ChatGPT в Bing, Office, Windows. Началась гонка вооружений: Google спешно запускала Bard (позже Gemini), Anthropic выпускала Claude, Meta – Llama.

Для образования:

Учителя запаниковали. Как проверять домашние задания, если их может написать робот? Школы начали запрещать ChatGPT, а потом поняли, что запретить нельзя, и начали учить работать с ним.

Для журналистики:

Появились статьи, полностью написанные ИИ. Новостные порталы начали эксперименты с генерацией контента. Качество упало, но количество выросло.

Для творчества:

Писатели испугались за свою работу. Сценаристы в Голливуде бастовали, требуя ограничений на использование ИИ. Художники уже пережили шок от Midjourney, теперь пришла очередь текста.

Темная сторона: Проблемы, которые остались

Успех ChatGPT не отменил проблем.

1. Галлюцинации.

Модель до сих пор уверенно врёт. Она не знает границ своего незнания. Если её спросить о том, чего нет в данных, она придумает правдоподобную чушь. В юридической практике уже были случаи, когда адвокаты ссылались на несуществующие дела, придуманные ChatGPT.

2. Предвзятость.

Модель впитала все предрассудки интернета. Она может выдавать стереотипные ответы, дискриминировать группы, повторять опасные идеи. OpenAI ставит фильтры, но идеально отфильтровать невозможно.

3. Безопасность.

Люди пытаются взломать модель, заставить её говорить запрещённое (jailbreak). Иногда получается. Инструкции по изготовлению бомб, способы взлома, оскорбления – всё это можно вытянуть, если знать как.

4. Зависимость.

Люди перестают думать сами. Зачем запоминать, если можно спросить? Зачем анализировать, если можно получить готовый ответ? Это меняет когнитивные привычки целого поколения.

Наследие: Что останется в истории

ChatGPT войдёт в историю как точка бифуркации – момент, когда ИИ стал массовым.

Как изобретение книгопечатания изменило доступ к знаниям, как интернет изменил доступ к информации, так ChatGPT изменил доступ к интеллектуальному труду.

Впервые в истории у каждого человека появился личный ассистент с энциклопедическими знаниями. Бесплатно. Круглосуточно. На любом языке.

И это только начало.

Твой ход: Четыре урока от ChatGPT

– Важны не только знания, но и подача. GPT-3 была умной, но невоспитанной. ChatGPT победил потому, что его научили общаться. В любой сфере навыки коммуникации важнее чистой экспертизы.

– Бесплатность меняет правила игры. OpenAI сделала ставку на доступность, и это сработало. Иногда лучшая бизнес-стратегия – отдать продукт бесплатно и захватить рынок.

– Люди хотят общения. Даже когда мы знаем, что говорим с машиной, нам важно, чтобы она была вежливой, полезной, эмоциональной. Мы ищем человеческого даже в коде.

– Технология нейтральна, но применение – нет. ChatGPT можно использовать для учёбы и для списывания, для творчества и для обмана. Выбор за тобой.

P.S.

Знаешь, что написал один пользователь в твиттере через неделю после запуска?

«Я сегодня разговаривал с ChatGPT три часа. О чём угодно. Он умнее большинства моих знакомых. И он никогда не устаёт от меня. Это одновременно прекрасно и пугающе».

Глава 16. DALL-E 2 / Midjourney: Как ИИ научился рисовать и что сказали художники

Крючок: Картина, победившая на конкурсе

Август 2022 года, Колорадо. Ярмарка искусств штата, ежегодный конкурс. В категории «Цифровое искусство / фотоманипуляция» жюри рассматривает работы и выбирает победителя.

Первое место получает картина «Théâtre D’opéra Spatial» («Театр космической оперы»). Это потрясающее полотно в стиле фэнтези: огромный зал в стиле барокко, через разбитый купол которого видно космическое пространство, фигуры в старинных костюмах, свет, фактура, глубина.

Жюри в восторге. Публика аплодирует.

А потом выясняется, что автора зовут Джейсон Аллен. Он не художник. Он настольный геймдизайнер, который никогда в жизни не брал в руки кисть. Свою работу он создал с помощью Midjourney – программы, генерирующей изображения по текстовому описанию.

Скандал разразился мгновенно. Художники кричали: «Это не искусство! Это читерство! Мы потратили годы, чтобы научиться рисовать, а какой-то парень напечатал текст и победил!».

Джейсон Аллен был спокоен. Он сказал: «Я создал это. Я написал сотни промптов, перебрал тысячи вариантов, отбирал, комбинировал, редактировал. Мой мозг – главный инструмент. А то, что я не держал кисть – неважно».

Мир искусства вошёл в эпоху турбулентности.

Герои: Два подхода к одной мечте

В 2022 году сразу несколько компаний представили революционные модели генерации изображений. Главных игроков было двое (и третий в тени).

DALL-E 2 (OpenAI).

Апрель 2022 года. OpenAI, создатели ChatGPT, выпускают вторую версию своей модели генерации картинок. Название – гибрид имени художника Сальвадора Дали и забавного робота ВАЛЛ-И из мультфильма Pixar.

DALL-E 2 была прорывом. Она понимала сложные запросы, генерировала фотореалистичные изображения, умела смешивать стили и объекты. За ней стояла технология CLIP (Contrastive Language-Image Pre-training) – нейросеть, которая училась сопоставлять тексты и картинки, понимая, что «синий круглый фрукт с косточкой» – это скорее всего черника.

OpenAI подошла к делу осторожно. Сначала доступ давали только по инвайтам, потом открыли лист ожидания. Только в сентябре 2022 года убрали все барьеры.

Midjourney (David Holz).

Июль 2022 года. Бывший инженер NASA Дэвид Хольц запускает свой проект. Но не как обычный сайт, а как бота в Discord. Ты заходишь на сервер, пишешь /imagine prompt: «космическая опера в стиле барокко», и через минуту бот присылает тебе 4 варианта.

Midjourney с самого начала сделала ставку на эстетику и художественность. В отличие от фотореализма DALL-E, Midjourney выдавала изображения с узнаваемым «художественным» стилем – сочным, насыщенным, часто мрачным или фантастическим. Именно это и обеспечило ей любовь художников (и победу на конкурсе).

Третий игрок: Stable Diffusion.

В августе 2022 года британский стартап Stability AI выпустил Stable Diffusion в открытый доступ. Это была революция внутри революции. Модель с открытым кодом, которую можно было скачать и запустить на своём компьютере. Бесплатно. Без ограничений. Миллионы людей установили её за несколько недель.

Конфликт: Что сказали художники

Реакция художественного сообщества была бурной и неоднозначной. Давай посмотрим на неё с помощью нашего метода трёх проекций.

Проекция программиста (Как это работает?)

Технология за всем этим великолепием называется диффузионные модели.

Представь, что ты берёшь идеальную фотографию и начинаешь добавлять на неё шум, пока она не превратится в полный хаос, как телевизор без сигнала. Диффузионная модель учится делать обратное – брать хаос и убирать шум, шаг за шагом восстанавливая картинку.

А направляет этот процесс текстовый промпт. Модель обучена на миллиардах пар «текст-картинка» (датасет LAION), и она знает, что сочетание слов «кот в шляпе» должно выглядеть примерно так.

Промпт-инжиниринг стал новым видом искусства. Люди пишут сотни слов, перебирают синонимы, добавляют имена художников, технические параметры, чтобы получить нужный результат. На онлайн-биржах продают «волшебные промпты», которые гарантированно дают красивые картинки.

Проекция философа (Что это меняет?)

Здесь начались самые горячие споры.

Аргумент 1: «Это убивает искусство»

Главный крик души художников: нейросети обучаются на наших работах без спроса и разрешения.

История с Грегом Рутковски стала символом этой проблемы. Рутковски – популярный цифровой художник, рисующий фэнтези. Его стиль оказался настолько востребован, что пользователи Midjourney начали массово добавлять «в стиле Грега Рутковски» в свои промпты. В результате его настоящее творчество стало тонуть в море подражаний. Люди искали его работы, а находили тысячи картинок, сгенерированных «под него».

Рутковски сказал: «Моё имя стало промптом. Мои работы используют, чтобы создавать конкурентов мне же. И никто меня не спросил».

Художники подали коллективные иски против Stability AI, Midjourney и других компаний, обвиняя их в «массовом нарушении авторских прав» – использовании миллионов изображений для обучения без лицензий и отчислений.

Аргумент 2: «Это не творчество, а компиляция»

Противники ИИ говорят: машина не творит, а перекомбинирует уже существующее. Она не вкладывает в работу душу, переживания, личный опыт. Искусство – это диалог между художником и зрителем, это история человека. А у машины нет истории.

Критики указывают, что ИИ легко справляется со стилями и техниками, но не умеет передать ту самую «человечность» – спонтанность, эмоциональную глубину, уникальный взгляд на мир.

Аргумент 3: «Это новый инструмент, не убивайте его»

Сторонники ИИ (и многие художники, принявшие технологию) говорят: это просто инструмент. Как фотография когда-то убила портретную миниатюру, но родила новое искусство. Как фотошоп когда-то казался «нечестным».

Пол Трилло, видеохудожник из Калифорнии, говорит: «Люди кричат, что это смерть художников. А я думаю, что это просто значит, что нам не придётся работать ночами и выходными».

Дон Аллен Стивенсон III, работавший в DreamWorks, признаётся: «Для меня это был экзистенциальный кризис в первый месяц. Я думал: „Боже, это же вся моя работа“. Но потом я понял, что это просто новый этап. Это страшно, если ты не готов меняться».

Проекция предпринимателя (Где здесь деньги?)

Бизнес-модели выстроились мгновенно.

Midjourney работает по подписке. Бесплатно – 25 картинок, потом от 10 до 60 долларов в месяц. К 2023 году это многомиллионный бизнес.

OpenAI монетизирует DALL-E через кредиты. Купил кредиты – генерируешь картинки.

Stable Diffusion выбрала другую стратегию: открытый код, а деньги на сервисах (DreamStudio), корпоративных лицензиях и инвестициях.

Shutterstock подписал соглашение с OpenAI и объявил, что будет выплачивать компенсации художникам, чьи работы использовались для обучения. Getty Images, наоборот, запретила ИИ-изображения и подала в суд на Stability AI.

Появился новый рынок – промпт-инженеры. Люди, которые умеют разговаривать с ИИ, чтобы получать идеальные картинки, зарабатывают десятки тысяч долларов. Как говорит архитектор из Zaha Hadid Architects Чхави Мехта: «Научиться составлять промпты – это целое искусство. Нужно понимать, как ИИ мыслит, какие слова сработают, как балансировать текст и веса».

Инсайт: Проблема рук и эволюция мастерства

Была одна забавная деталь, которая выдавала ИИ с головой. Руки.

Долгое время нейросети не умели рисовать руки. Пальцев могло быть шесть, семь, они могли расти из неожиданных мест, загибаться под невозможными углами. Это стало мемом и главным способом отличить ИИ-картинку от реальной.

Но технологии развиваются. Midjourney v5, вышедшая в 2023 году, наконец-то научилась рисовать руки. И это символично. Каждая новая версия стирает ещё одну границу между «подделкой» и «реальностью».

Наследие: Новый мир творчества

Что оставил нам 2022 год?

1. Демократизация творчества.

Рисовать может каждый. У тебя есть идея? Ты можешь её визуализировать за минуту. Не нужно 10 лет учиться академическому рисунку. Это открывает двери миллионам людей, у которых нет технических навыков, но есть воображение.

2. Новые профессии.

Промпт-инженер, ИИ-художник, куратор генераций. Появились люди, которые совмещают традиционные навыки с новыми инструментами. В Zaha Had Architects, например, активно используют и Midjourney, и DALL-E для проектирования.

3. Этические вопросы без ответов.

Что считать кражей, а что – вдохновением? Если человек учится на картинах старых мастеров – это норма. Если машина учится на миллионах картинок – это воровство? Где граница?

4. Кризис аутентичности.

Фотография перестала быть доказательством. Искусство перестало быть гарантией человеческого труда. Мы вступаем в эпоху, где вопрос «Это сделал человек?» будет звучать всё чаще.

Твой ход: Четыре урока от DALL-E и Midjourney

– Инструмент не определяет художника. Фотоаппарат не отменил фотографов. ИИ не отменит художников. Он просто изменит правила игры. Те, кто адаптируются, выживут и расцветут. Те, кто будут отрицать, – останутся в прошлом.

– Важна идея, а не исполнение. Раньше, чтобы воплотить идею, нужно было владеть техникой. Теперь техника есть у всех. Конкуренция переходит в плоскость замысла, концепции, уникальности видения.

– Этику нужно обсуждать. Просто запретить нельзя. Просто разрешить – страшно. Нужны новые законы, новые нормы, новое понимание авторства. Это работа для всех нас.

– Учись «разговаривать» с ИИ. Навык формулировать запросы, точно выражать свои мысли, подбирать слова становится критическим. В мире, где машины понимают текст, умение писать промпты – новая грамотность.

P.S.

Знаешь, что сказал Сэм Альтман, когда его спросили, ожидали ли они такого бума?

«Мы всегда знали, что это важно. Но чтобы настолько… Нет, не ожидали. Мы просто построили модель и наблюдали, как мир сходит с ума. Это первый раз, когда технология ИИ действительно зажгла обычных людей».

Глава 17. GitHub Copilot: История о том, как ИИ стал напарником программиста

Крючок: Миллиардная сделка и внезапный релиз

Лето 2021 года. Microsoft уже потратила миллиард долларов на инвестиции в OpenAI, но мир пока не увидел ничего революционного. GPT-3 впечатляет, но остаётся демо-версией. И вдруг 29 июня компания GitHub (принадлежащая Microsoft) тихо объявляет о запуске технической预览-версии инструмента под названием GitHub Copilot.

Никакой громкой рекламы. Никаких пресс-конференций. Просто плагин для Visual Studio Code, который умеет… дописывать код за программиста.

Реакция сообщества была мгновенной и бурной. Одни кричали: «Это конец профессии!». Другие: «Наконец-то!». Третьи: «Как это вообще работает?».

Но все чувствовали одно: что-то изменилось. Впервые искусственный интеллект сел за один стол с программистом и стал не просто инструментом, а напарником.

Герои: Тандем, изменивший разработку

За этим прорывом стояли две компании и одна технология.

GitHub – крупнейший в мире хостинг для кода. Миллионы репозиториев, миллиарды строк кода, вся история современного программирования. У GitHub было то, без чего невозможен ИИ, – данные.

OpenAI – исследовательская лаборатория, созданная для безопасного развития AGI. У них была технология – OpenAI Codex, прямой потомок GPT-3, но обученный не на текстах, а на коде.

Грег Брокман, технический директор OpenAI, объяснял разницу просто: «GPT-3 генерирует текст на английском. Codex генерирует код. Он понимает не только синтаксис, но и то, что программа должна делать».

Обучение Codex было титаническим: 159 гигабайт кода Python из 54 миллионов публичных репозиториев GitHub. Модель впитывала в себя не просто синтаксис, а логику, паттерны, подходы тысяч разработчиков по всему миру.

Конфликт: До-копилотовская эра

Чтобы понять масштаб перемен, нужно вспомнить, как программисты работали раньше.

Представь, что ты пишешь функцию на Python. Ты знаешь, что нужно сделать, но забыл точный синтаксис или название метода. Что ты делаешь?

– Открываешь браузер

– Гуглишь запрос

– Листаешь Stack Overflow

– Копируешь пример

– Возвращаешься в редактор

– Вставляешь и правишь под свои нужды

Этот цикл отнимал минуты, разрывал концентрацию, выбивал из потока. По оценкам, программисты тратили до 30% времени не на написание кода, а на поиск решений.

И это были простые случаи. А если нужно было разобраться в незнакомом фреймворке? Изучать документацию днями.

Copilot предложил другой путь: не искать, а генерировать. Прямо в редакторе, без переключения контекста, за секунды.

Развязка: Как работает напарник

Принцип работы Copilot гениален в своей простоте. Ты пишешь комментарий или начало функции, а Copilot предлагает продолжение.

Пример 1: Комментарий в код

Ты пишешь:

python

# Create an API endpoint using the FastAPI framework that accepts a JSON payload in a POST request

Copilot генерирует готовый код с правильным синтаксисом, импортами, обработкой ошибок.

Пример 2: Имя функции

Ты вводишь:

python

def get_tweets_from_user

Copilot дописывает тело функции – авторизацию, запрос к API, обработку ответа, возврат данных.

Пример 3: Шаблонный код

Ты создаёшь HTML-форму с полем и кнопкой, а Copilot добавляет JavaScript-обработчик, валидацию, отправку данных.

Главное, что Copilot не просто копирует готовые куски. Он генерирует новый код, комбинируя миллионы паттернов из обучающей выборки. Технический директор GitHub Нэт Фридман подчёркивал: «Система не копирует, она понимает контекст и создаёт подходящее решение».

Инсайт: Парное программирование с призраком

GitHub назвал Copilot «ваш AI-парный программист» (your AI pair programmer). Это не маркетинговый трюк, а точное описание.

В парном программировании два человека работают вместе: один пишет код, другой постоянно проверяет, предлагает идеи, замечает ошибки. Copilot делает то же самое, но с одной важной оговоркой: он не понимает код, но статистически предсказывает правильные решения.

Для опытного программиста Copilot стал ускорителем. Он берёт на себя рутину, позволяя сосредоточиться на архитектуре и сложных задачах. Для новичка – наставником, показывающим, как обычно решаются типовые задачи.

Но появилась и новая проблема. Чтобы Copilot работал хорошо, нужно научиться с ним разговаривать. Качество запроса (промпта) стало критическим навыком. Расплывчатое «сделай API» даёт мусор. Чёткое «создай эндпоинт на FastAPI, принимающий JSON в POST-запросе» – готовый код.

Наследие: От автодополнения к автономности

С 2021 года Copilot прошёл огромный путь. В июне 2022 года инструмент вышел из предварительной версии и стал платным – $10 в месяц или $100 в год. Студентам и мейнтейнерам open-source проектов – бесплатно.

К 2025 году Copilot превратился в нечто гораздо большее, чем автодополнение.

Copilot Chat позволил общаться с ИИ прямо в редакторе, задавать вопросы о коде, просить объяснить сложные места.

Copilot Agent взял на себя асинхронные задачи – тестирование, проверку, создание pull-реквестов. Разработчик может просто поставить задачу, а Copilot сам разберётся с репозиторием, отредактирует файлы, запустит тесты и оповестит о результате.

Copilot CLI перенёс магию в терминал. Теперь можно писать «найди команду, которая покажет изменения за последние 3 коммита», и Copilot выполнит её.

Copilot с мультимодальностью (2025) научился превращать картинки в код – нарисовал интерфейс, получил HTML/CSS.

Модели тоже эволюционировали. Copilot последовательно интегрировал GPT-4, GPT-5, а в конце 2025 года добавил Claude Opus 4.5 от Anthropic, позволяя выбирать лучшую модель под задачу.

Цифры, которые впечатляют

К 2025 году Copilot стал не просто инструментом, а стандартом индустрии:

– Более 2000 разработчиков по всему миру используют Copilot

– 90% компаний из списка Fortune 100 внедрили его в свои процессы

– В ноябре 2025 года Copilot получил престижную премию World Internet Conference Leading Technology Award

– В январе 2026 года Microsoft сообщила, что 30% всего кода в её репозиториях генерируется с помощью AI (Copilot и аналоги)

Темная сторона: Критика и риски

Успех Copilot не отменяет серьёзных проблем.

<1...4 5 6 7 >

На страницу:

Перейти

6 из 7