Полная версия
Рисуем на пару с нейросетью! Создаем шедевры фотографии, живописи, рисунка
В меню раздела Mode мы отмечаем, что автоматически перешли в режим работы «от картинки к картинке» (ImagetoImage), и тут же видим выбранное нами уменьшенное изображение натюрморта.
Сразу под ним находится поле PromptStrength («сила промпта»). Тычем в него, и перед нами появляется шкала с бегунком; диапазон значений на шкале – от 0.1 до 1.0. Что означают эти числа? Прямо над шкалой по-английски написана «шпаргалка» о том, как работает этот алгоритм – вот ее перевод:
«Чем выше число, тем больше новых деталей будет в изображении. Чем ниже показатель, тем ближе к оригиналу выйдет картинка».
То есть если мы возьмем максимально низкий показатель – 0.1, то изображение вообще останется нетронутым и наши попытки внести хоть какие-то изменения будут равны нулю. Если же мы переметнемся на другой конец шкалы и выставим 1.0, то никогда не узнаем в новом творении свой натюрморт.
Для того чтобы оставить основное изображение как есть, но при этом внести некоторые изменения, мы осторожно подвинем бегунок на отметку 3.5 – показатели в диапазоне от 3.0 примерно до 4.0 помогают умеренно преобразовывать оригинальный рисунок.
Ну что, совершили это важное действие? Если да, тогда приступим к составлению технических подсказок для нейросети. Записывать мы их будем в поле Prompt сразу же после имеющегося там текста. И не пугайтесь терминологии из области фотографии: я объясню, что значат непонятные слова и цифры – на самом деле они совсем не так страшны, даже если вы никогда не пользовались своим фотоаппаратом в режиме ручной съемки. Для нас сейчас главное – понять, зачем эти настройки вообще нужны: ухватив суть, мы потом сможем писать текст обычными словами, добиваясь того же эффекта, какого фотографы достигают при помощи своих хитрых настроек.
Шаг 2
«Nikon D3500, обычный объектив, диафрагма f/7.1, ISO 200, выдержка 1/125 с. Фокус на деталях вазы с цветами. Средняя глубина резкости, плавное размытие создают мягкое и умиротворяющее настроение».
Nikon D3500, normal lens, aperture f/7.1, ISO 200, shutter speed 1/125 s. Focus on the details of the vase with flowers. Middle depth of field and smooth blurring create a soft and soothing mood.
Вы что, уже в обмороке от обилия терминов? Все нормально, сейчас вместе в них разберемся. Итак, начнем с объектива – вы же помните, что у фотографов их целая куча и они нещадно оттягивают плечи, если те куда-то выезжают со всем своим профессиональным скарбом? А мы с вами в гораздо более выгодном положении: нам всего-то нужно написать, какой именно объектив выбрать, чтобы добиться такого же (ну или почти такого же) результата.
Обычный объектив (или фикс-объектив) – универсальный и незаменимый инструмент для создания натюрморта, поскольку позволяет контролировать всю композицию, не искажая объекты и не нарушая перспективу. Он также дает возможность создавать более драматичные фотографии с хорошим контрастом и яркими цветами, так как не смягчает картинку и обеспечивает более четкое и детальное изображение.
Далее, нам нужно настроить три параметра – диафрагму, выдержку и светочувствительность, которые отвечают за экспозицию – количество света, который попадает на датчик камеры и отвечает за качество снимка, делая его сбалансированным, а не пересвеченным или чересчур темным. Звучит страшно, но помните, что нам лишь нужно понять основной принцип применения этих настроек, чтобы давать нейросети команды для создания нужный эффекта.
Итак, диафрагма: в фотоаппарате это отверстие, которое контролирует количество света, попадающего в объектив камеры, и измеряется в диафрагменных числах – например, f/16. Что касается создания изображений в Dreamerland, значение диафрагмы влияет на степень размытости изображения – это ключевой элемент, который позволяет нам контролировать фокус и глубину резкости снимков.
Принцип здесь такой: чем меньше числовое выражение диафрагмы (f/1.8, f/3.5, f/4.5), тем больше будут размыты предметы, находящиеся не в фокусе. И наоборот, чем выше число (f/11, f/16, f/22), тем более четким будет изображение.
Для натюрморта в среднем подходит следующий диапазон значений диафрагмы: f/3.5 – f/16. Но конкретное значение зависит от композиции, которую вы создаете, и настроения, которое хотите передать. Например, при малой глубине резкости для размытия фона будет использоваться значение f/3.5. А для более четкого изображения с большим количеством объектов в фокусе будет применяться f/16.
Далее, светочувствительность ISO – параметр, который определяет, насколько чутко сенсор камеры реагирует на свет. Зависимость такая: чем больше число ISO, тем светлее кадр. Когда света достаточно, ставьте на фотоаппарате ISO 100 или ISO 200. Если немного не хватает – держитесь в районе ISO 400 – ISO 800. В сумерках и полумраке значения ISO могут находиться в диапазоне от 1000 до 1600. В современных цифровых камерах значения и того больше: 3200, 6400 – при таких показателях можно смело делать снимки даже в непроглядной ночи.
И наконец, выдержка. Выдержкой называют время экспозиции, в течение которого затвор камеры остается открытым и на матрицу попадает свет. Большинство кадров делается на коротких выдержках – в сотые и тысячные доли секунды. Но есть снимки и с длинной выдержкой – в 20 или 30 секунд. Отдельные объекты на таких фотографиях остаются четкими, а другие красиво смазаны – например, на пейзажном снимке ночного города огни автомобилей сливаются в единый цветной поток.
Все, больше не мучаю вас никакими объяснениями – пора применять знания на практике: вводите в поле Prompt данные из Шага 2, ждите, когда ИИ сгенерирует снимок, и смотрите, как изменился наш натюрморт!
Рис. 6. Натюрморт с хризантемами
Ну, что у нас получилось на этот раз? Ага, за счет легкого размытия фоновых предметов появился объем, которого до этого не было. Хризантемы «ожили», будто напитались водой, а сухостой на заднем плане стал более приглушенного цвета и больше не отвлекает внимание от цветов в вазе. Кожица яблока теперь выглядит более натуральной, и изображение в целом стало больше походить на фотографию, нежели раньше – ай да нейросеть, ай да молодчина!
В принципе, на этом можно было бы и завершить создание нашего изображения, но раз уж жанр натюрморта принадлежит к сфере искусства, то я хочу предложить вам еще один этап работы – словесное описание атмосферы, настроения снимка и, возможно, еще чувств, которые вы бы хотели вложить в свое произведение, а также эмоциональный отклик, который ваша фотография способна вызвать в зрителях.
Ну, это уже вообще черт-те что, можете воскликнуть вы, все равно эмоции и чувства невозможно увидеть на картине, так зачем же тратить время, пытаясь выразить их словами! А вот тут вы и ошибаетесь, возражу я вам: всякое искусство рождается в двух мирах – видимом мире образов, звуков, слов, движений, и одновременно в невидимом мире души Творца. За каждым видимым образом и слышимым звуком всегда стоит бесплотная авторская идея, его настроение, жизненный опыт, и именно невидимое присутствие талантливого создателя делает его произведение живым и даже осязаемым. Подобно тому как Бертольд Брехт сказал в коротеньком стихотворении: «Театр – это не то, что вы видите на сцене, театр – это то, что происходит за кулисами», можно утверждать, что искусство – это не то, что вы видите на картине, а то, что происходило в голове и душе художника, когда он ее создавал.
Ну ладно, неохотно уступаете вы, но ведь машина-то не может оживить произведение, у нее хоть и интеллект, но все же искусственный! Машина не может, соглашусь я, но вы способны ей помочь начать «чувствовать», давая творческие задания – как-никак нейросеть создана по образу и подобию человеческого мозга и способна многому научиться. Так давайте ей подарим шанс стать настоящим художником!
Предлагаю сделать так: если вы считаете, что подобная работа – пустая трата времени, то можете остановиться на полученном результате, а если хотите поэкспериментировать, тогда сочиним еще один промпт для создания нашего натюрморта и посмотрим, что из нашей затеи вышло.
А, еще один момент: в самом конце текста не забудьте написать слово в слово абракадабру, которую я вам давал в прошлый раз – если вы помните, этот набор символов поможет улучшить качество изображения:
High res, -testp, -upbeta -upbeta -upbeta
Шаг 3
«Изображение словно подернуто едва заметной, легкой и грустной дымкой. Теплую осеннюю атмосферу создают неяркие цвета и фактуры хризантем, яблока, камня, а также мягкий, спокойный свет, заполняющий пространство и подчеркивающий очертания предметов. Натюрморт словно рассказывает о красоте и безмятежности смены времен года, которые всегда приходят и уходят в свой срок, не раньше и не позже. Картина напоминает о том, что не стоит никуда торопиться, что нужно наслаждаться простыми вещами и ценить каждый маленький момент в жизни. Изображение может вызывать чувство бесконечной благодарности и покоя».
The image is as if covered with a barely noticeable, light and sad haze. A warm autumn atmosphere is created by the soft colors and textures of chrysanthemums, apple, stone, as well as gentle, calm light that fills the space and highlights the shapes and forms of the objects. The still life seems to tell about the beauty and serenity of the changing seasons that always come and go at their proper time, not earlier and not later. The picture reminds us to take our time, slow down and enjoy the simple things in life, as well as appreciate every little moment of it. The image may evoke feelings of eternal gratitude and peace.
Рис. 7. Натюрморт с хризантемами
Знаете, ребята, лично я доволен последним штрихом. По картине словно прошлись кистью времени: камень – символ вечности – зрительно состарился, «запыленные» ветки мимозы еще больше отодвинулись в далекое, непроглядное прошлое, «пожилые» хризантемы ведут тихое, неназойливое существование в старомодной вазе, а вот яблоко, наоборот, как бы выдвинулось на передний план – наверное, оно символизирует те самые маленькие радости сегодняшнего дня, о которых всегда следует помнить.
Видите, последний кусок текста ничего не прибавил и не убавил в плане композиции, но чуть изменилась атмосфера – и натюрморт сразу «оброс» новыми смыслами. Так работает искусство, друзья…
***
Если вы вдруг захотите еще раз воспользоваться этим же самым промптом, но при этом создать новое изображение, не связанное с предыдущим, то в личном кабинете выберите получившийся натюрморт, но вместо кнопки Evolve внизу страницы нажмите на Clone («клонировать») слева от нее. Вас тут же перенаправят на страницу редактирования снимков, и почти в самом низу вы увидите поле Seed, где появилось некое многозначное число. Это автоматически сгенерированное число нашего изображения. Мы ничего не будем с ним делать, а поднимемся вверх, где в окне Prompt снова оказался текст для нашего осеннего натюрморта. Теперь в поле Mode выберите режим TexttoImage и нажмите на кнопку Start Drawing. Процесс клонирования запущен!
Рис. 8. Осенний натюрморт
У меня неожиданно получился вот такой яркий снимок – а что, осень ведь бывает разная: грустная и праздничная, блеклая и полная насыщенных красок. После философского изображения в приглушенных тонах нейросеть решила нас порадовать солнечным снимком с сентябрьским разноцветьем. Как видите, с композицией ИИ не сильно заморачивался, лишь по-новому преподнес отдельные предметы, но зато радикально изменил характер и настроение фотографии – что ж, спасибо ему за такое дивное разнообразие.
Глава 3. Пейзажный снимок
Сегодня мы с вами попытаемся создать зимний горный пейзаж с вулканом на заднем плане.
Пейзаж – один из самых распространенных и популярных эстетских жанров изобразительного искусства. Здесь объектом изображения являются природные ландшафты, подчеркивающие красоту, величие и разнообразие окружающей среды, ее текстур, элементов и т.д. Пейзажи можно писать, рисовать или фотографировать, цель же изображения природных красот состоит в том, чтобы запечатлеть основные элементы, краски, формы и характер местности, а также передать ощущение присутствия в этом месте.
Помните, в прошлый раз мы с вами создавали натюрморт в три этапа: сначала досконально описывали композицию, потом задавали настройки для своего фотоаппарата, а в конце «оживляли» фотографию, наполняя ее смыслами и эмоциями. Предлагаю пользоваться тем же «алгоритмом» и сейчас, и впредь – так у вас появятся стойкие навыки создания промптов для нейросети, а бонусом еще и научитесь на базовом уровне обращаться с фототехникой в ручном режиме. Если же вы и так опытный фотограф, то на втором этапе написания промптов можете смело экспериментировать с собственными настройками. Пусть каждый берет из книги только то, что считает нужным.
Перед тем, как мы начнем писать промпт, не забудьте выбрать модель Dreamer Photoreal V2 (со вкладкой Balanced в меню fine-tuning); в разделе Mode – вкладку Text to Image, а в поле Sampling Steps установите желаемое количество шагов генерации снимка (желательно не меньше 25, а вообще чем больше, тем лучше). В разделе Sampling method по умолчанию оставляем метод Euler A для создания реалистичных фотоизображений.
Что касается Aspect ratio, то на этот раз выберем формат 3:2 – горизонтальный кадр идеально подходит для создания пейзажей и крупномасштабных панорамных снимков, потому что человеческий глаз именно в таком ракурсе лучше всего воспринимает бескрайние природные ландшафты.
Давайте сегодня обратим внимание на поле Guidance Scale («соответствие запросу»), которое расположено сразу за строкой Sampling method. Здесь мы даем нейросети указание, насколько точно ей нужно выполнять промпт. По умолчанию на шкале выставлен показатель 7.0 – при этом значении ИИ довольно точно следует тексту, однако может допускать некоторые «вольности». Чем ниже число, тем больше самостоятельного творчества проявляет нейросеть, генерируя снимок, а чем показатель выше, тем ближе результат к исходному тексту. Давайте установим бегунок на отметке 8.0, чтобы с большей вероятностью получить желаемый результат.
Шаг 1
«Высокореалистичная пейзажная фотография, где на среднем плане изображена живописная горная деревушка, расположенная на равнине между холмами. Снимок сделан с более высокой точки холма на переднем плане, поэтому сверху видны цветные крыши деревни и небольшие домики. На заднем плане великолепный конусообразный вулкан, его вершина и склоны покрыты замысловатыми снежными узорами. Кадр четко разделен на три горизонтальных слоя, и акцент делается на композиционной связи между снежным плато переднего плана, деревушкой и драматичным горным пейзажем. Раннее утро, и кадр заполнен почти мистическим светом лучей восходящего солнца. Этот свет окрашивает воздух и предметы в нежные тона и создает удивительно красивые контрасты. Cбалансированные естественные цвета».
Highly realistic landscape photograph showing a picturesque mountain village in the middle ground, located on a plain between hills. The picture was taken from a higher point on the hill in the foreground, so the colored rooftops of the village and small houses can be seen from above. In the background is a magnificent cone-shaped volcano, its peak and slopes covered with intricate snow patterns. The frame is clearly divided into three horizontal layers, and the emphasis is on the compositional connection between the foreground snowy plateau, the village and the dramatic mountain landscape. It's early morning, and the frame is filled with almost mystical light of the rising sun rays. This light colors the air and objects in delicate tones and creates amazingly beautiful contrasts. Well balanced natural colors.
Вы, наверное, заметили, что мы все более и более подробно прописываем детали композиции, дотошно объясняя содержание переднего, среднего и заднего планов. При этом можем себе позволить сочинять целые предложения, не боясь, что нейросеть нас не поймет. Английский язык благодатен в том отношении, что искусственный интеллект его прекрасно воспринимает фразами, а вот русский для него пока туговат, поэтому в русифицированных генераторах изображений ИИ улавливает смысл лишь отдельных слов и словосочетаний.
Рис. 9. Горный ландшафт с вулканом
Итак, смотрите, «художник» практически идеально выстроил композицию, передал краски и настроение раннего утра. Однако есть что-то неестественное, «рисованное» в снеге, и домики будто картонные. Поэтому давайте сразу добавим в окне Prompt следующие слова: «идеальная текстура снега, деревьев, холмов и поверхности строений» (perfect texture of snow, trees, hills and building surfaces). А в поле Negative Prompt напишем: «изменения в композиции» (changes of the composition). Вы, наверное, помните, что здесь мы прописываем то, чего хотели бы избежать при дальнейшей обработке изображения.
Ну а теперь в личном кабинете выбираем получившийся у нас снимок, нажимаем на кнопку Evolve, и в поле Prompt сразу после имеющегося текста задаем настройки для фотоаппарата.
Шаг 2
«Nikon D850, ISO 400, 1/100 с, f/11, средняя глубина резкости; фокус на деревне среднего плана, четкая, детальная прорисовка строений; зум-объектив: 120–300 мм; телеобъектив для получения детального и хорошо скомпонованного изображения с возвышенности; штатив».
Nikon D850, ISO 400, 1/100 s, f/11, middle depth of field (DOF); focus on the middle ground village, a clear and detailed drawing of the buildings; zoom lens: 120-300mm; a telephoto lens for capturing a detailed and well-composed image from an elevated position; tripod.
Давайте разберемся в новых терминах из области фотографии, а заодно и вспомним те, что нам уже знакомы. Одно из таких новых понятий – «глубина резкости». Что это такое?
Глубина резкости изображаемого пространства (по-английски – DOF) показывает, насколько фотография сфокусирована. Если основной объект находится в фокусе, но передний план или фон размыты, тогда это говорит о том, что глубина резко изображаемого пространства мала (shallow DOF). Напротив, если большинство объектов съемки находятся в фокусе, включая передний план и фон, это означает, что у фотографии большая глубина резко изображаемого пространства (deep DOF). Глубина резкости определяет, что находится в фокусе снимка, тем самым заостряя внимание на каком-то определенном объекте на изображении и не отвлекая внимание зрителя на второстепенные детали, которые автор снимка не желает акцентировать.
Понятие «глубина резкости» тесно связано с числовым показателем раскрытия диафрагмы фотоаппарата, которое, если вы помните, обозначается вот так: f/3.5, f/5.6, f/8. Чем меньше число, тем больше открыта диафрагма и тем более мелкой будет глубина резкости. Малая глубина резкости характерна, например, для натюрмортов. Чем больше числовое значение (f/16, f/22), тем больше предметов окажется в фокусе.
В пейзажной фотографии применяют как малую, так и большую глубину резко изображаемого пространства – в зависимости от того, желает ли фотограф сфокусировать внимание только на одном объекте или же хочет расширить фокус и достаточно резко изобразить большее количество деталей. При изображении горного пейзажа большая глубина резкости позволяет зрителю почувствовать расстояние от объектов переднего плана до гор, расположенных на заднем плане, так как все планы находятся в фокусе и создают ощущение глубины и объема пространства. А на психологическом уровне большая глубина резкости помогает создать на снимке расслабляющую и успокаивающую атмосферу, делая акцент на гармонии изображаемой сцены.
Для нашего ландшафтного снимка мы использовали диафрагменное число f/11, которое в фотографии обычно считается средней глубиной резкости, особенно в сочетании со средним телеобъективом. При такой глубине резкости часть снимка находится в фокусе, в то время как большая область, окружающая объект, немного или сильно размыта. Средняя глубина резкости отлично подходит для создания в целом сбалансированного изображения, где некоторое размытие фона придает снимку глубину и эстетическую привлекательность.
Еще мы сегодня столкнулись с понятием «телеобъектив». Давайте разберемся, когда его нужно применять.
Телеобъектив обычно используется в пейзажной фотографии для захвата удаленных элементов пейзажа – гор, водопадов и даже зданий. Телеобъектив позволяет «приближать» отдаленный пейзаж и снимать нужные детали, создавая ощущение обширного пространства. С помощью телеобъектива также можно изолировать отдельные элементы ландшафта – дерево, камень и т.д., создавая уникальную и эффектную композицию.
Также мы с вами использовали зум-объектив с диапазоном фокусных расстояний от 120 до 300 мм. Подобный диапазон позволяет мастеру выбрать точное расстояние, соответствующее его видению объекта, композиции и перспективы. Кроме того, зум-объектив дает возможность быстро и легко настроить угол и композицию кадра без необходимости использовать несколько объективов или перемещать камеру.
Как зум-объективы, так и телеобъективы предназначены для того, чтобы фотограф мог «приближать» объекты и делать их детальные снимки; основное же различие между ними заключается в фокусном расстоянии. Зум-объектив предлагает более широкий диапазон фокусных расстояний, что позволяет легко переключаться между различными видами без потери качества изображения и необходимости смены объектива. Телеобъектив предназначен для очень больших расстояний, обычно обеспечивая гораздо более «узкое» поле зрения и позволяя фотографу «приблизиться» к объекту съемки.
Комбинация зум-объектива и телеобъектива может значительно расширить спектр творческих возможностей фотомастера. С зум-объективом он может легко переключаться между различными углами зрения, чтобы найти правильную композицию для сцены, а телеобъектив обеспечивает более плотную композицию и фокусировку, помогая вывести объект пейзажа на передний план и создать глубину изображения. Применяя их одновременно, фотограф может уловить все детали и текстуры сцены, получая при этом четкую и привлекательную композицию.
Рис. 10. Горный ландшафт с вулканом
Пока я вам объяснял новые термины, ИИ успел выдать изображение с учетом настроек фотоаппарата и использования объективов. Давайте посмотрим, как это повлияло на снимок.
Сразу бросается в глаза, что молодой конусообразный вулкан под кистью нашего «художника» состарился и стал живописной скалой с прихотливым рельефом. Однако я не буду настаивать на том, чтобы мне вернули изначальный вариант, потому что так вышло намного красивее! Сгладилась «мультяшность» предыдущего изображения с его четко прорисованными, чересчур яркими домиками, и появилась цельность сбалансированного снимка. Более правдоподобно стал выглядеть снег, приятно акцентирована елочка на краю ближайшего к нам холма и несколько строений. Как видите, наши числовые настройки не были напрасными – наоборот, они весьма улучшили качество снимка.