Полная версия
Рисуем на пару с нейросетью! Создаем шедевры фотографии, живописи, рисунка
Если вы решили, что на этом можно остановиться и не усовершенствовать изображение, то это ваше право. Я же предлагаю продолжить эксперимент и перейти к третьему этапу обработки ландшафта, дав нейросети инструкции по моделированию эмоционального фона нашего снимка.
Шаг 3
«Атмосфера полного умиротворения и спокойствия; горный пейзаж вызывает чувство благоговения и тихого внутреннего восторга. Вечная красота и величие момента восхода солнца в горах вдохновенно выражены с помощью света и тени, придающих сцене драматизм и яркость».
An atmosphere of complete peace and tranquility; the mountain landscape evokes a sense of awe and quiet inner delight. The timeless beauty and majesty of the moment of sunrise in the mountains is expressed with great inspiration by the use of light and shadow, giving the scene dramatic and bright character.
После этих слов, полных восхищения, не забудьте написать «заклинание», состоящее из набора нечленораздельных букв и слов: HQ, 8k, -beta -beta -beta.
Если вам интересно, что означают отдельные элементы этой абракадабры, то я их вам охотно объясню.
HQ – сокращение от high quality (высокое качество).
8k – это формат с разрешением примерно 8000 пикселей по горизонтали, позволяющий получать изображения непревзойденной четкости в цифровом кинематографе и компьютерной графике. Как вариант можете указывать формат 4k, что тоже очень круто.
Что касается -beta -beta -beta, то это вариант уже известной нам команды -upbeta, используемой в нейросети для улучшения качества изображения. Здесь главное не переусердствовать с количеством слов, так как каждое повторение команды заставляет нейросеть стараться изо всех сил, чтобы усовершенствовать рисунок, и в результате может получиться «чересчурово». Так что будьте внимательны в ходе своих экспериментов.
Рис. 11. Горный ландшафт с вулканом
Разница между вторым и третьим изображением довольно заметна, вы не находите? Роскошный рельеф вулкана вызывает у меня чувство восхищения; домики стали более резкими, но при этом не потеряли своего естественного вида, а бархатистую поверхность холмов и текстуру леса прямо ощущаешь пальцами! Так что, друзья, мы можем себя поздравить с очередным удачным снимком.
***В фотографии есть понятие золотой час – время суток вскоре после восхода солнца или перед закатом, когда свет выглядит более красным и мягким, чем при высоком положении светила. «Золотой час» иногда также называют «волшебным», потому что в это время можно не бояться ни прямого солнечного света, ни жесткого контрового освещения, усложняющего процесс съемки, и все вокруг буквально залито золотом – в такие минуты снимок в любом случае получится хорошо. Давайте и мы попробуем создать предзакатный пейзаж, когда солнце вот-вот опустится за горизонт.
Prompt
Высокореалистичный фотопейзаж с причудливым безлистым деревом во время заката, когда солнце находится совсем близко к горизонту. Солнечные лучи играют в ветвях дерева и золотят пространство вокруг. В верхней части снимка на небе чудесные прозрачные облака. Потрясающая минималистичная композиция с интересными деталями; все части изображения идеально сбалансированы. Профессиональная камера с идеальными настройками для фотографии «золотого часа». Небольшая глубина резкости. Картина обладает некой мистической атмосферой и завораживает зрителя своей божественной красотой. Шедевр. Высокое разрешение, 4k, -testp, -beta beta -upbeta.
A highly realistic photography landscape with a quaint-looking leafless tree at the time of sunset when the sun is quite near the horizon. The sun rays play in the tree branches and make everything look golden. In the upper part of the pic there are gorgeous transparent clouds in the sky. Stunning minimalistic composition with interesting details; all the parts of the depiction are perfectly balanced. Professional camera with best settings for the “golden hour” pics. Shallow DOF. The picture has certain mystic atmosphere and charms the viewer with its divine beauty. Masterpiece. High res, 4k, -testp, -beta beta -upbeta.
Параметры для генерации снимка: Model – Dreamer Photoreal V2 (fine-tuning: Epic), Aspect Ratio – 1:1, Guidance Scale – 14:0, Sampling Method – Euler A, Steps – 40.
Рис. 12. Дерево в лучах закатного солнца
Вы наверняка заметили, что в этом промпте я не стал предлагать точные числовые настройки для фотоаппарата и даже не стал указывать, какой именно камерой мы делаем снимок. Вместо этого ограничился словесным описанием (профессиональная камера с идеальными настройками) и указал малую глубину резкости. Как видите, даже с таким скромным набором подсказок фотография получилась весьма эффектной и с приличным качеством. А все почему? А все потому, что в конце нашего «лирического сочинения» мы написали слово шедевр (Masterpiece). Вы можете посмеяться, но ИИ понимает каждое слово буквально и cделает все, чтобы выдать нам именно то, что мы просим. И еще открою маленький секрет: слово «шедевр» в промптах так же популярно, как и «мантра» -beta / -upbeta. Его пишут все кому не лень, однако результат далеко не у каждого получается сногсшибательный: чтобы создать в нейросети настоящее произведение искусства, нужно потратить немало времени и сил на поиски верного слова. Так что, друзья, запасайтесь терпением, баллами для работы (credits) – и вперед, к вершинам художественного мастерства!
Глава 4. Портрет
Сегодня мы поработаем в прекрасном жанре фотопортрета, не возражаете?
Портрет в фотографии – это изображение человека или группы людей, созданное фотографом для изображения его / их внешности и характера. Портрет может отражать особые физические и психологические качества человека или фиксировать эмоции, которые он в этот момент испытывает. Портреты могут быть постановочными или спонтанными. Выбор места, композиции и освещения имеет важное значение в портретной фотографии и позволяет мастеру передать личность объекта, отношение к ситуации и эмоциональное состояние.
Хочу сразу предупредить: принимаясь за создание реалистического изображения человека в нейросети, мы можем столкнуться с проблемами весьма деликатного характера: ну, допустим, у нашего фотоперсонажа вдруг окажется четыре ноги, от трех до семи пальцев на руках, кожа на шее нежно-зеленого оттенка и т.п. Прежде всего желательно сразу принять тот факт, что нейросеть никогда не видела человека собственными глазами (хотя бы потому, что у нее нет глаз!), поэтому, получив в ответ на своей запрос неадекватный рисунок, не надо на нее визжать и в гневе швырять телефон наземь. Всегда следует помнить: мы в состоянии исправить любой допущенный машиной «косяк», дав ей четкие указания, что нужно и чего не нужно рисовать в человеческом теле.
Советую сразу запомнить несколько слов и словосочетаний, которые всегда обязательно прописывать в промптах, если вы работаете с «фотографией» человека: «реалистичный» (realistic), сверхреалистичный (super realistic / hyper realistic), «идеальная текстура человеческой кожи» (ideal human skin texture), «живые и выразительные глаза» (lively and expressive eyes), «реалистичные человеческие зрачки» (realistic human-like pupils), «естественное выражение лица» (natural face expression), «реалистичный цвет лица и тела» (realistic face and body color).
И желательно сразу писать в поле Negative Prompt то, чего следует избегать нейросети при генерации снимка: «нереалистичная форма носа / глаз / рта» (unrealistic form of the nose / eyes / mouth), «плохо нарисованные пальцы / руки / ступни» (badly drawn fingers / hands / feet), «неестественное выражение лица» (unnatural facial expression), «слишком много / мало пальцев на руках / ногах» (too many / few fingers on hands / feet), «нереалистичные глаза / зрачки» (unrealistic eyes / pupils).
Итак, если вас не испугали возможные трудности при изображении человеческого лица и тела, то предлагаю сделать выразительный снимок… ну, допустим, чернокожей девушки в белоснежной одежде. Что, круто? Да, мне тоже нравится эта идея!
Обычный формат для создания портретов – 2:3, но сегодня я хочу вам предложить поработать с менее привычным для этого жанра форматом 1:1, потому что с ним иногда удается добиться более выразительных изображений. Поэтому в поле Aspect Ratio выбираем это число – и поехали!
Шаг 1
«Реалистичный портрет чернокожей улыбающейся девушки 19 лет, изображенной по грудь и стоящей в три четверти на фоне белой стены. У стены шероховатая текстура, которая контрастирует с гладкой кожей лица девушки. Девушка одета в стильное белое платье, на ней белая шляпа и аксессуары. У нее уверенное и немного ироничное выражение лица, а в блестящих глазах прочитывается легкий смех. Текстура кожи идеальная, лицо очень реалистичное; у девушки в высшей степени реалистичные глаза с живыми и выразительными человеческими зрачками. Весь облик девушки несет яркие и позитивные вибрации. Композиция фокусируется на слегка подсвеченном лице девушки; задний план отличается эффектной драматической подсветкой и имеет легкое размытие, что придает снимку глубину и зрительно отделяет персонажа от стены. Изображение носит стильный и привлекательный характер».
A highly realistic chest-deep portrait of a black smiling girl aged 19, standing three-quarters against a white wall. The wall has a rough texture that contrasts with the girl's smooth skin. The girl is dressed in a stylish white dress, she is wearing a white hat and accessories. Her face has a confident and slightly ironic expression, and gentle laughter can be read in her sparkling eyes. The texture of her skin is perfect, the face is very realistic; the girl’s eyes are extremely realistic, with lively and expressive human-like pupils. The girl’s whole appearance carries bright and positive vibes. The focus is on the girl's slightly rim-lit face; the background is spectacularly backlit and has subtle blur that adds depth to the shot and separates the subject from the wall. The image is stylish and attractive.
Рис. 13. Портрет чернокожей девушки
Ну что, как вам портрет? По-моему, превосходный! Эта очаровательная юная леди в белом – само совершенство, не находите? И вообще изображение исполнено внутренней гармонии и динамизма – возможно, благодаря квадратной форме снимка, а может, потому, что он черно-белый.
Ладно, похвалили сами себя – и дальше за работу: нам нужно правильно настроить камеру и свет в студии, чтобы не испортить такое удачное начинание.
Шаг 2
«Canon 5D Mark IV с объективом Canon 135 мм f/2.0 L. Камера на штативе, направлена на девушку, зум объектива установлен на фокусное расстояние 105 мм. ISO 400, 1/200 с., f/3.5. Вспышка состоит из двух выносных стробоскопов, одного для основного света в студии и одного для контрового / контурного света: это обеспечивает драматичную и реалистичную настройку освещения, чтобы подчеркнуть черты лица девушки и фон.
Canon 5D Mark IV, with a Canon 135 mm f/2.0 L lens. The camera is on a tripod, aimed at the girl, and the lens zoom is set to the 105 mm focal length. ISO 400, 1/200 s., f/3.5. The flash equipment consists of two off-camera strobes, one for main lighting in the studio and one for back/rim lighting, providing a dramatic and realistic lighting setup to bring out the girl's features and the background.
Сегодня мы с вами познакомились с несколькими типами освещения, которые используются при создании фотопортрета. Это основной свет (main light / key light) и контровой, или контурный свет (backlight / rimlight).
Как основной, так и контурный свет являются стандартными методами освещения, используемыми в портретной фотографии. Основное освещение – это основной источник света, используемый для освещения объекта и придания глубины изображению. Его можно расположить спереди или немного сбоку от объекта, создавая блики и тени для более реалистичного и трехмерного вида. Контурный свет является вторичным источником света, который размещается позади объекта, освещая его сзади и по бокам и создавая красивую окантовку. Эта техника используется для создания тонкого свечения и отделения объекта от фона, добавляя изображению глубину и «гламурный» вид.
Рис. 14. Портрет чернокожей девушки
Мне кажется, снимок стал немного темнее, и чтобы при следующей обработке еще больше не прибавилось мрака, давайте сразу запишем в поле Negative Prompt: «слишком темное изображение» (too dark image). Что же касается технической стороны фото, то разница, на мой взгляд, очевидна: изображение стало глубже, девушка словно выдвинулась на передний план, благодаря освещению проявилась текстура шляпы и платья.
Но что же произошло с самой девушкой? Вам не кажется, что она немного повзрослела, пока фотограф настраивал свое оборудование? Из лица красотки ушла некая детскость и простота, делавшие ее такой очаровательной. Сейчас глаза немного насмешливо прищурены, а в уголке рта появилось ироничное выражение. Хм… Даже интересно, что же с девушкой будет дальше. Впрочем, давайте не будем гадать, а просто перейдем к третьему этапу работы – если хотите, конечно…
Шаг 3
«Благодаря харизме и внутренней подвижности девушки у снимка очень притягательная аура. От него исходит мощная энергия уверенности и оптимизма. Образ имеет едва уловимую игривую нотку, но полон внутренней силы и драматизма. Фото покоряет своим обаянием, вдохновляет и целиком захватывает внимание зрителя. HQ, 8k, -testp, -beta -upbeta -beta».
Thanks to the girl’s charisma and her inner mobility, the shot has a very attractive aura. It produces a powerful energy of confidence and optimism. The image has a subtle playful note, but is full of inner strength and drama. The pic captivates with its charm, inspires and captures completely the viewer’s attention. HQ, 8k, -testp, -beta -upbeta -beta.
Вы, наверное, заметили, что у нас очень обстоятельные промпты, целые эссе, а вот текстовая вместимость в поле Prompt ограничена 1500 знаками. Что делать, если мысль еще не закончена и кое-что хочется обязательно добавить, а места уже нет? Все просто: в английском тексте можете убирать артикли перед существительными, а сами существительные заменять местоимениями – умный ИИ в любом случае вас поймет. Еще избегайте повторений, если только они не сделаны специально, чтобы привлечь внимание нейросети. А вот точками и запятыми не пренебрегайте, чтобы вместо четкой идеи не получилась каша. Словом, подходите к делу творчески и не бойтесь экспериментировать, а насколько удачно вы это будете делать, покажут ваши изображения.
Рис. 15. Портрет чернокожей девушки
Итак, что мы имеем на выходе? Изображение в целом смягчилось, стало более сбалансированным; ушла резкость при передаче фактуры ткани; девушку оставило чересчур ироничное настроение, и в ее облике снова появилась мягкость, несколько утраченная во втором снимке. И хотя в лице героини больше нет детской открытости, она от этого не стала менее привлекательной и харизматичной.
***Среди любителей создавать изображения в нейросетях популярен метод выделения важных текстовых моментов с помощью числовых обозначений: 0.8, 1.4, 1.9 и т.д. – в целом диапазон колеблется от 0.0 до 2.0. Логично предположить, что чем больше число, тем сильнее вы хотите подчеркнуть ту или иную деталь в картинке. При создании портрета таким образом акцентируют глаза, кожу, волосы и т.д. Допустим, если в женском лице вы хотите лишь намекнуть на подводку для глаз, то можете ограничиться числом 0.5. А для прически можно использовать более высокий показатель, например, 1.5. Здесь главное не переусердствовать, особенно с макияжем и тоном кожи, а то получите картинку с какими-нибудь красно-желто-фиолетовыми пятнами по всему телу.
Выделения с помощью чисел обычно оформляются следующим образом: (волнистые волосы: 1.6) или (пухлые губы: 1.3). Деталь, которую вы хотите акцентировать, нужно взять в скобки, чтобы нейросеть ясно понимала, на что именно обращать особое внимание.
Давайте для примера напишем промпт для создания фотографии молодой женщины, используя подобные числовые показатели.
«Высокореалистичный портрет поразительно красивой женщины примерно 28 лет, которая сфотографирована по грудь. Она идеально выглядит, очень чувственна, элегантно одета, но имеет немного (разочарованное и усталое выражение глаз: 0.7); в руке у нее (бокал вина: 1.8). (Подводка для глаз: 1.1); (реалистичная кожа: 1.2); живые выразительные глаза с (реалистичными зрачками: 1.3); (волнистые волосы платинового цвета: 1.4); (выразительный рот с утонченными губами: 1.5). В целом, в образе женщины есть что-то загадочное и притягательное. Идеальные настройки камеры для тускло освещенного бара. Малая глубина резкости. HQ, 4k, -testp, -beta -beta -beta».
A highly realistic chest-deep portrait of a strikingly beautiful woman of about 28 years old. She looks perfect, she is very sensual, dressed elegantly, but has a bit (disappointed and tired expression in her eyes: 0.7). She has (a glass of wine: 1.8) in her hand. (Eyeliner: 1.1); (realistic skin: 1.1); lively expressive eyes with (realistic pupils: 1.3); (wavy blonde platinum hair: 1.4); (expressive mouth with refined lips: 1.5). There's something mysterious and captivating in the overall image of the woman. Perfect camera settings for a dim-lit bar space. Shallow DOF. HQ, 4k, -testp, -beta -beta -beta.
Параметры для генерации изображения: Model – Dreamer Photorealistic V2, Style – Photography: Realistic / Cannon EOS 5D Mark IV, -ar 2:3, Guidance Scale – 9.0, Sampler – Euler A, Steps – 40.
Рис. 16. Портрет женщины с бокалом
Портрет получился чудесный, и отличить изображение от настоящей фотографии довольно трудно (если, конечно, сильно не всматриваться – тогда будут заметны некоторые ляпы). Нам повезло ничего не напортачить с числовыми показателями, поэтому, если вы захотите поэкспериментировать в промптах с числами, смело это делайте, ну а мне, гуманитарию, все-таки проще и привычнее управляться со словами.
Изображения с человеческими лицами можно совершенствовать до бесконечности, добиваясь все большего правдоподобия и выразительности, но иногда полезно остановиться, на какое-то время отложить снимки, а потом окинуть их свежим взглядом – тогда вдруг ясно высветятся недостатки, которых мы не заметили в процессе работы, и придут свежие идеи о том, как улучшить фотографию. Поэтому предлагаю вам отдохнуть от портретов и поработать с каким-нибудь другим жанром – уверяю, это будет не менее интересно и познавательно.
Глава 5. Уличная фотография
Вам не кажется, что мы засиделись дома в окружении своих питомцев или в студии, погруженные в создание натюрмортов и портретов? Не пора ли нам выйти на улицу – подышать свежим воздухом, а заодно попробовать себя в жанре уличной фотографии?
Уличная фотография – это очень динамичная и откровенная форма фотоискусства, разновидность социальной фотографии, которая предполагает создание снимков в общественных местах (на улицах, тротуарах, площадях, в зданиях, переулках) с целью запечатлеть правдивые моменты современной жизни, а также сцены взаимодействия между людьми. Фотограф пытается передать атмосферу, сущность, характер улицы, взаимодействуя с окружающей средой и людьми и ставя перед собой цель получить естественные и спонтанные кадры. В жанре уличной фотографии ценится реальность момента, а не талантливая режиссура сцены, поэтому такие снимки часто делаются при помощи телеобъектива (наверное, чтобы не смущать участников событий). Работа в этом жанре может стать отличной тренировочной площадкой для фотографов, поскольку позволяет им совершенствовать навыки в композиции и умении рассказывать истории.
Однако если фотограф умеет подсмотреть историю и «рассказать» ее с помощью готового снимка, то нам для начала нужно самим придумать ситуацию или описать интересный момент, свидетелем которого когда-то стали. Давайте словами «нарисуем» уютную сцену кормления птиц на площади или бульваре – вы наверняка не раз ее наблюдали – и опишем детали этой картины в промпте.
Так как из-за обилия объектов композиция на этот раз будет сложнее предыдущих, то приготовьтесь к тому, что поначалу ИИ будет выдавать нам совсем не такие качественные изображения, как в более простых снимках. Пока что для него еще очень сложно реалистично изобразить фигуру человека в различных ракурсах и адекватно передать черты лица. Запаситесь терпением, несколькими десятками баллов (credits) и раз за разом просите машину улучшить снимок, сделав его как можно более похожим на настоящее фото.
Сегодня мы познакомимся с одним важным инструментом для того, чтобы дать ИИ понять, на что именно ему нужно обратить внимание при генерации изображения – это функция «вес слова». Как мы с ней работаем? В полях Prompt и Negative Prompt выделяем скобками те слова, которые вам кажутся наиболее важными, при этом чем больше скобок окружают слово или словосочетание, тем больший вес оно приобретает в «глазах» нейросети. Допустим, запись может выглядеть так: (реалистичное лицо), ((гладкая текстура кожи)), (((идеально нарисованные пальцы))) и т.д. Непосредственно в тексте эти слова будут автоматически выделяться разными цветами – синим, красным и т.п.
Ну что, начинаем работать? В этот раз мы с самого начала пропишем наши «условия» как в поле Prompt, так и в Negative Prompt. Тем самым мы сразу дадим нейросети понять, что мы желаем и чего не желаем видеть на снимке. Ну а слова в скобках уже сами будете выделять: вы лучше знаете, что для вас важнее.
Шаг 1
«Высокореалистичная уличная фотография: на переднем плане молодой человек в костюме, сидя на корточках, кормит голубей. Птицы гуляют по мощеной площади. На заднем плане на площади европейского города работает фонтан. Совершенная анатомия лица, идеальные реалистичные руки и пальцы, идеальная текстура кожи человека. Высокореалистичная текстура зданий, тротуара, воды в фонтане и фигур людей. Композиция с энергичным, необычным ракурсом. Естественный уличный свет днем после 17 часов, непрямые лучи солнца дают мягкое, но в то же время динамичное освещение картины. Длинный телеобъектив установлен под широким углом, чтобы создать глубину и ощущение перспективы в кадре. Увеличение масштаба с помощью зум-объектива, чтобы показать мужчину в центре кадра: акцент на его фигуре. -ar 3:2, high res, 8k, -testp, -beta -beta -beta».
Highly realistic street photography: in the foreground, a young man in a suit feeds pigeons while squatting. Birds walk on the paved square. In the background a fountain is working in the square of a European city. Perfect face anatomy, ideal realistic hands and fingers, perfect human-like skin texture. Highly realistic texture of buildings, pavement, fountain water, and people’s figures. A composition with an energetic, unusual angle. Natural street light in the afternoon, after 5 p.m. , the indirect rays of the sun give a soft, but at the same time dynamic lighting of the picture. The long telephoto lens is mounted at a wide angle to create depth and a sense of perspective in the frame. Zoom in to show the man as the center of the shot: focus on his solitary figure. -ar 3:2, HQ, -testp,8k, -beta -beta -beta.