bannerbanner
Логика промтирования
Логика промтирования

Полная версия

Логика промтирования

Настройки чтения
Размер шрифта
Высота строк
Поля

Алексей Щинников

Логика промтирования

Введение

Мы живём в эпоху чудес, которые стали настолько привычными, что почти перестали замечаться. Попросите машину написать сонет в стиле Шекспира о любви к утреннему кофе – и через мгновение перед вами появятся рифмованные строки. Закажите ей изображение кота-астронавта, плывущего сквозь туманность Андромеды, – и она создаст картину, поражающую воображение. Этот новый собеседник, искусственный интеллект, ворвался в нашу жизнь как джинн из бутылки, готовый исполнять творческие желания. Он стал нашим оракулом, поэтом, художником и инженером. Мы задаём вопросы и получаем ответы, формулируем задачи и видим их воплощение. Кажется, что мы наконец-то обрели идеального помощника, способного понять любой наш замысел.

Но что происходит, когда магия даёт сбой? Почему, попросив создать логотип для инновационного стартапа, мы часто получаем предсказуемый набор клише – лампочку, шестерёнку или схематичный мозг? Почему эссе на сложную философскую тему оказывается поверхностным пересказом статьи из «Википедии», лишённым глубины и оригинальной мысли? Почему нейросеть, способная нарисовать фотореалистичный портрет, вдруг спотыкается на простой просьбе сделать изобретение?

Ответ на эти вопросы прост и одновременно ошеломляющ: мы говорим с инопланетянином. Мы пытаемся вести диалог с формой разума, которая не имеет ничего общего с нашим собственным сознанием. Нейросеть не «понимает» концепцию кота или астронавта. Она не «знает», что такое любовь, и не «испытывает» вдохновения. Её мир – это не мир идей, чувств и физических законов, а безграничный вероятностный гобелен, сотканный из математических связей между словами и пикселями. Когда вы произносите слово «заяц», нейросеть не представляет себе пушистого зверька, прячущегося под кустом. Вместо этого в её глубинах активируется целая сеть ассоциаций, статистических «нитей», которые с огромной вероятностью ведут к слову «лес», потому что в триллионах обработанных ею текстов эти два слова появлялись вместе несчётное количество раз. Нейросеть – это гениальный статистический попугай, который знает, какое слово должно следовать за предыдущим, но не имеет ни малейшего представления об их смысле.

Именно в этом и кроется фундаментальная проблема нашего общения. Мы обращаемся к нейросети как к человеку, ожидая интуитивного понимания, способности читать между строк и улавливать тонкие намёки. А она, в свою очередь, воспринимает наши слова как чистый сигнал, как стартовую точку для путешествия по своему статистическому лабиринту. Любая неточность, любая двусмысленность в нашей инструкции отправляет её по ложному пути, приводя к результатам, которые нас разочаровывают. Мы злимся на машину, не осознавая, что ошибка кроется не в ней, а в нашем способе коммуникации. Мы пытаемся управлять сложнейшим инструментом, размахивая им как дубиной, хотя он требует точности скальпеля.

Чтобы преодолеть эту пропасть, нам нужна новая дисциплина. Это не просто умение «задавать вопросы», а подлинное искусство и наука конструирования точных, ясных и непротиворечивых инструкций. Эта дисциплина называется промтированием.

Промтирование – это работа инженера идей, который проектирует задание для цифрового разума с той же тщательностью, с какой архитектор проектирует здание. Он должен понимать материал – природу нейросети, и владеть инструментами – языком, на котором можно и нужно отдавать приказы.

Но каков этот язык? Неужели для работы с нейросетями нам придётся изучать сложные коды и языки программирования? К счастью, нет. Существует универсальный язык, который лежит в основе любого разумного построения, будь то человеческая речь, математическая формула или компьютерная программа. Этот язык – логика.

В этой книге мы представим вам систему, которая позволит овладеть этим языком в совершенстве. Она называется Самологика – наука о самостоятельном, творческом мышлении, основанная на строгих и проверенных веками приёмах формальной логики. Самологика станет нашим розеттским камнем, который поможет расшифровать мышление искусственного интеллекта и научиться говорить с ним на одном языке. Она вооружит нас набором из двадцати фундаментальных логических приёмов – от анализа и синтеза до аналогии и идеализации, – которые превратят наши расплывчатые творческие порывы в кристально ясные инструкции. Мы научимся объяснять и давать задания, а также выстраивать для нейросети маршрут, ведущий точно к желаемой цели.

Это путешествие изменит ваш взгляд на творчество и технологии. Вы поймёте, что граница между хаосом и порядком, между бессмысленным набором данных и гениальным произведением, пролегает через умение мыслить логически. Вы перестанете быть пассивным пользователем, который надеется на удачу, и станете активным творцом, архитектором цифровой реальности, способным вести осмысленный и плодотворный диалог с самым мощным интеллектуальным инструментом, когда-либо созданным человечеством.

Промт или промпт?

В любой новой области, на стыке технологий и культуры, неизбежно возникают споры, которые со стороны могут показаться незначительными, но для участников сообщества они полны глубокого смысла. Один из таких споров, развернувшийся на наших глазах, касается всего одной буквы в одном-единственном слове. Как правильно писать и произносить термин, обозначающий инструкцию для нейросети: «промт» или «промпт»? Этот вопрос – не просто придирка грамматического пуриста. Это настоящее лингвистическое расследование, которое, как капля воды, отражает всю сложность, историю и даже социальную динамику нарождающейся дисциплины промтирования.

Чтобы добраться до истины, нам, подобно детективам, следует начать с происхождения улики. Слово пришло к нам из английского языка, где prompt означает «подсказку», «напоминание» или, в нашем контексте, «поручение». Однако английский язык, как известно, не един. Существует как минимум два его основных диалекта: британский и американский. И здесь нас ждёт первый важный поворот сюжета. В британском английском, с его более чётким произношением согласных, слово звучит приблизительно как [prompt] – отчётливо слышится звук «п». В американском же варианте, где гласные звуки часто более открыты и продолжительны, произношение иное – [prɑːmpt], где звук «п» практически редуцируется и почти не слышен. Для русского уха это звучит скорее как «прамт» или «прэмт».

Казалось бы, всё просто: технология генеративных нейросетей, и в первую очередь ChatGPT, была разработана и популяризирована в США. Следовательно, логично было бы ориентироваться именно на американское произношение. По этому принципу в русском языке должен был бы закрепиться вариант «промт». Однако в официальных словарях, в частности в «Русском орфографическом словаре» Российской академии наук, было зафиксировано написание «промпт».

Как же произошло это недоразумение? Вероятнее всего, мы имеем дело с поспешностью, вызванной стремительным ростом популярности термина. Составители словаря, столкнувшись с необходимостью быстро внести в него новое слово, пошли по пути наименьшего сопротивления. Они ориентировались не на живое звучание (фонетику), а на написание (орфографию). Они увидели английское слово prompt и механически перенесли все буквы в кириллицу, не углубляясь ни в тонкости произношения, ни в принципы адаптации заимствований. Это распространённая ошибка, когда мёртвая буква оказывается важнее живого звука.

Дело, однако, не столько в споре между Лондоном и Калифорнией, сколько в законах самого русского языка. Принципы заимствования стремятся к фонетической точности и удобству произношения. Написание «промпт» создаёт на конце слова труднопроизносимое и неестественное для русской речи скопление трёх согласных – «мпт». Это избыточная конструкция, противоречащая фонетической логике. Вариант «промт» не только точнее передаёт американское звучание, породившее сам феномен, но и гораздо органичнее ложится на русскую фонетическую систему. Неудивительно, что именно этот вариант – «промт» – изначально использовали первые российские разработчики в этой области, например, компания «Яндекс», и авторы первых книг на эту тему в России.

Этот лингвистический казус породил любопытный социальный феномен. В среде энтузиастов, погрузившихся в мир ChatGPT с самого начала, написание «промпт» стало восприниматься как маркер новичка, профана, человека поверхностного, который не разобрался в сути вопроса. Это, конечно, субъективное восприятие, но оно указывает на формирование своеобразной кастовости, где «старожилы», использующие исторически и фонетически более корректный термин «промт», отделяют себя от «пришедших позже».

Вся эта ситуация до боли напоминает знаменитую аллегорию Джонатана Свифта из «Путешествий Гулливера» о войне между тупоконечниками и остроконечниками. Целые народы Лилипутии и Блефуску вели кровопролитные войны из-за непримиримого разногласия о том, с какого конца – тупого или острого – следует разбивать варёные яйца. Наш спор о «промте» и «промпте» – это такая же война на идеологической почве, бессмысленная и отвлекающая от главного.

Сам факт этой вражды говорит о том, что заимствованное слово, каким бы оно ни было, остаётся для нашего языка чужеродным. Возможно, лучшим решением было бы придумать собственное русское слово. По смыслу оно должно означать «задание для нейросети». Если же придумать новое слово затруднительно, можно обратиться к сокровищнице родственных славянских языков. Другой путь, традиционный для научных терминов, – создание гибридов с греческим языком, как в слове «нейрон». Так могли бы появиться «нейрозапрос», «нейропоручение» или «нейрозадание», а «промт-инженер» превратился бы в «нейропоручителя».

Так или иначе, пока идёт этот процесс лингвистической адаптации, нам необходимо сделать выбор. В этой книге, следуя логике, исторической правде и фонетическому удобству, мы будем использовать написание «промт».

Но сам этот спор должен служить нам постоянным напоминанием. Он учит нас, что в работе инженера идей нет мелочей. Точность начинается с выбора правильного слова. И наша способность договориться о терминах – это первый шаг к созданию ясного, осмысленного и непротиворечивого будущего в нашем диалоге с искусственным интеллектом.

Глава 1. Как «думает» нейросеть

Представьте себе необъятную библиотеку, настолько огромную, что она содержит все книги, когда-либо написанные человечеством. В ней есть всё: от «Повести временных лет» до последнего научного журнала, от бульварных романов до философских трактатов, от кулинарных рецептов до инструкций по сборке космических кораблей. А теперь вообразите библиотекаря, который провёл в этом хранилище всю свою жизнь. Он не просто прочитал каждую книгу – он проанализировал её на молекулярном уровне. Он не знает, что такое «любовь», но он знает, что в 87% сонетов это слово рифмуется со словом «кровь» и часто соседствует со словами «сердце», «боль» и «луна». Он не понимает вкуса яблочного пирога, но может с точностью до миллиграмма предсказать, какое количество корицы упоминается рядом со словом «яблоко» в поваренных книгах XVIII века. Этот библиотекарь – превосходная метафора для понимания того, как «думает» нейросеть.

Когда мы говорим о «мышлении» искусственного интеллекта, мы невольно становимся жертвой антропоморфизма склонности приписывать человеческие качества нечеловеческим объектам. Мы смотрим на сгенерированный нейросетью текст или изображение и предполагаем, что за ним стоит процесс, схожий с нашим собственным: понимание, осмысление, творческое озарение. На самом же деле внутри этой «чёрной коробки» нет ни сознания, ни понимания в человеческом смысле. Там нет «призрака в машине». Там царит её величество Статистика.

Давайте вернёмся к нашему примеру с зайцем и лесом. Когда вы вводите в нейросеть промт «Нарисуй зайца», что происходит на самом деле? Система не обращается к некоему внутреннему каталогу «животные» и не извлекает оттуда образ длинноухого грызуна. Вместо этого она преобразует ваше слово «заяц» в сложный математический объект – вектор, который представляет собой точку в многомерном пространстве. В этом пространстве все понятия, когда-либо встреченные нейросетью, расположены не хаотично, а в соответствии с их контекстной близостью. Слова «король» и «королева» будут находиться рядом, так же как «яблоко» и «груша». И вот, найдя точку, соответствующую «зайцу», нейросеть начинает искать её ближайших соседей.

Благодаря анализу миллиардов текстов и изображений, она «знает», что понятие «заяц» статистически очень тесно связано с понятиями «лес», «трава», «морковка», «уши» и «хищник». Слово «лес» оказывается одним из самых сильных «магнитов» в этом смысловом поле. Поэтому, не имея никаких дополнительных указаний, нейросеть с огромной вероятностью поместит своего сгенерированного зайца именно в лесной пейзаж. Она не «решила», что зайцы живут в лесу. Она просто последовала по пути наименьшего статистического сопротивления, по самой протоптанной информационной тропинке. Это не акт понимания, а акт вероятностного предсказания.

Этот же принцип работает и при генерации текста. Когда нейросеть пишет эссе, она не строит в уме логическую структуру аргументации. Она просто предсказывает, какое слово или фраза с наибольшей вероятностью должны следовать за предыдущими, основываясь на закономерностях, извлечённых из гигантского корпуса текстов. Именно поэтому её ответы часто кажутся такими гладкими и правдоподобными – она виртуозно имитирует стиль человеческой речи. Но эта же особенность делает её уязвимой. Если в обучающих данных преобладали тексты определённого толка, нейросеть будет воспроизводить их снова и снова, попадая в ловушку «статистического среднего». Она будет генерировать наиболее ожидаемый, а не наиболее оригинальный или точный ответ.

Так рождается главный миф о нейросетях – миф о понимании. Сила искусственного интеллекта заключается не в его способности понимать нас, а в его феноменальной способности управлять ассоциативными цепочками. Он – мастер контекста. Он может связать воедино стиль Ван Гога, сюжет «Звёздных войн» и образ вашей кошки, потому что в его многомерном пространстве существуют «тропинки», соединяющие все эти понятия.

Наша задача как промт-инженеров – не надеяться, что нейросеть интуитивно угадает наши мысли, а самим проложить для неё нужный маршрут по этому пространству.

Именно здесь интуитивный подход терпит поражение, а логический – одерживает победу. Интуиция хороша, когда мы общаемся с другим человеком, чьё мышление схоже с нашим. Мы можем рассчитывать на общий культурный код и жизненный опыт. Но при общении с нейросетью интуиция бесполезна. Попытка «почувствовать», какой запрос сработает лучше, похожа на попытку угадать выигрышные номера в лотерее. Результат будет случайным и непредсказуемым.

Логический же подход превращает нас из игроков в архитекторов. Вместо того чтобы бросать в машину расплывчатые идеи, мы начинаем конструировать инструкции. Мы понимаем, что каждое слово в нашем промте – это не просто просьба, а команда, активирующая определённые области в статистическом пространстве нейросети. Мы осознаём, что, добавляя уточняющие детали («не просто дерево, а старый дуб»), мы сужаем поле поиска. Указывая на противоречие («летающий пингвин»), мы заставляем её искать нестандартные, творческие пути. Задавая строгую структуру, мы заставляем её следовать нашему плану, а не блуждать по своим вероятностным лабиринтам.

Таким образом, ключ к власти над этим новым могущественным инструментом лежит не в попытках говорить с ним «по-человечески», а в освоении универсального языка структуры и порядка. Мы должны перестать видеть в нейросети загадочного «призрака в машине» и научиться видеть её истинную сущность – грандиозный, но подчиняющийся строгим законам вероятностный механизм. И как только мы это сделаем, мы перейдём от случайных творческих удач к систематическому и управляемому созиданию.

Глава 2. Компас для интеллекта

Итак, мы стоим на пороге нового мира, лицом к лицу с цифровым разумом, чья природа чужда нашему собственному сознанию. Мы выяснили, что общение с ним вслепую, полагаясь на интуицию и догадки, – это путь к разочарованиям и случайным результатам. Чтобы диалог стал плодотворным, нам необходим надёжный навигационный инструмент, своего рода компас, который позволит уверенно прокладывать курс в безбрежном океане нейросетевых ассоциаций. Этим инструментом и является Самологика.

Что же скрывается за этим несколько необычным термином? Самологика – это практическая наука о самостоятельном (творческом) мышлении, фундаментом для которой служит обязательное применение приёмов формальной логики. Давайте разберём это определение на составные части, ведь, как мы скоро убедимся, точность формулировок – это основа нашего нового ремесла.

Во-первых, Самологика – это практическая наука. Она не ставит своей целью погружение в отвлечённые философские дебри или жонглирование сложными терминами ради самого процесса. Каждая её концепция, каждый её приём направлен на достижение конкретного, измеримого результата: повышение качества и оригинальности идей, а также эффективности их воплощения. Это не теория ради теории, а набор отточенных инструментов, готовых к немедленному применению в работе, будь то создание промта для нейросети, разработка бизнес-стратегии или написание научного труда.

Конец ознакомительного фрагмента.

Текст предоставлен ООО «Литрес».

Прочитайте эту книгу целиком, купив полную легальную версию на Литрес.

Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.

Конец ознакомительного фрагмента
Купить и скачать всю книгу