Рисуем на пару с нейросетью! Создаем шедевры фотографии, живописи, рисунка
Шрифт:
Параметры для генерации изображения: Model – Dreamer Photorealistic V2, Style – Photography: Realistic / Cannon EOS 5D Mark IV, – ar 2:3, Guidance Scale – 9.0, Sampler – Euler A, Steps – 40.
< image l:href="#"/>Рис. 16. Портрет женщины с бокалом
Портрет получился чудесный, и отличить изображение от
Изображения с человеческими лицами можно совершенствовать до бесконечности, добиваясь все большего правдоподобия и выразительности, но иногда полезно остановиться, на какое-то время отложить снимки, а потом окинуть их свежим взглядом – тогда вдруг ясно высветятся недостатки, которых мы не заметили в процессе работы, и придут свежие идеи о том, как улучшить фотографию. Поэтому предлагаю вам отдохнуть от портретов и поработать с каким-нибудь другим жанром – уверяю, это будет не менее интересно и познавательно.
Глава 5. Уличная фотография
Вам не кажется, что мы засиделись дома в окружении своих питомцев или в студии, погруженные в создание натюрмортов и портретов? Не пора ли нам выйти на улицу – подышать свежим воздухом, а заодно попробовать себя в жанре уличной фотографии?
Уличная фотография – это очень динамичная и откровенная форма фотоискусства, разновидность социальной фотографии, которая предполагает создание снимков в общественных местах (на улицах, тротуарах, площадях, в зданиях, переулках) с целью запечатлеть правдивые моменты современной жизни, а также сцены взаимодействия между людьми. Фотограф пытается передать атмосферу, сущность, характер улицы, взаимодействуя с окружающей средой и людьми и ставя перед собой цель получить естественные и спонтанные кадры. В жанре уличной фотографии ценится реальность момента, а не талантливая режиссура сцены, поэтому такие снимки часто делаются при помощи телеобъектива (наверное, чтобы не смущать участников событий). Работа в этом жанре может стать отличной тренировочной площадкой для фотографов, поскольку позволяет им совершенствовать навыки в композиции и умении рассказывать истории.
Однако если фотограф умеет подсмотреть историю и «рассказать» ее с помощью готового снимка, то нам для начала нужно самим придумать ситуацию или описать интересный момент, свидетелем которого когда-то стали. Давайте словами «нарисуем» уютную сцену кормления птиц на площади или бульваре – вы наверняка не раз ее наблюдали – и опишем детали этой картины в промпте.
Так как из-за обилия объектов композиция на этот раз будет сложнее предыдущих, то приготовьтесь к тому, что поначалу ИИ будет выдавать нам совсем не такие качественные изображения, как в более простых снимках. Пока что для него еще очень сложно реалистично изобразить фигуру человека в различных ракурсах и адекватно передать черты лица. Запаситесь терпением, несколькими десятками баллов (credits) и раз за разом просите машину улучшить снимок, сделав его как можно более похожим на настоящее фото.
Сегодня мы познакомимся с одним важным инструментом для того, чтобы дать ИИ понять, на что именно ему нужно обратить внимание при генерации изображения – это функция «вес слова». Как мы с ней работаем? В полях Prompt и Negative Prompt выделяем скобками те слова, которые вам кажутся наиболее важными, при этом чем больше скобок окружают слово или словосочетание, тем больший вес оно приобретает в «глазах» нейросети. Допустим, запись может выглядеть так: (реалистичное лицо), ((гладкая текстура кожи)), (((идеально нарисованные пальцы))) и т.д. Непосредственно в тексте эти слова будут автоматически выделяться разными цветами – синим, красным и т.п.
Ну что, начинаем работать? В этот раз мы с самого начала пропишем наши «условия» как в поле Prompt,
Шаг 1
«Высокореалистичная уличная фотография: на переднем плане молодой человек в костюме, сидя на корточках, кормит голубей. Птицы гуляют по мощеной площади. На заднем плане на площади европейского города работает фонтан. Совершенная анатомия лица, идеальные реалистичные руки и пальцы, идеальная текстура кожи человека. Высокореалистичная текстура зданий, тротуара, воды в фонтане и фигур людей. Композиция с энергичным, необычным ракурсом. Естественный уличный свет днем после 17 часов, непрямые лучи солнца дают мягкое, но в то же время динамичное освещение картины. Длинный телеобъектив установлен под широким углом, чтобы создать глубину и ощущение перспективы в кадре. Увеличение масштаба с помощью зум-объектива, чтобы показать мужчину в центре кадра: акцент на его фигуре.
– ar 3:2, high res, 8k, -testp, -beta -beta -beta».
Highly realistic street photography: in the foreground, a young man in a suit feeds pigeons while squatting. Birds walk on the paved square. In the background a fountain is working in the square of a European city. Perfect face anatomy, ideal realistic hands and fingers, perfect human-like skin texture. Highly realistic texture of buildings, pavement, fountain water, and people’s figures. A composition with an energetic, unusual angle. Natural street light in the afternoon, after 5 p.m. , the indirect rays of the sun give a soft, but at the same time dynamic lighting of the picture. The long telephoto lens is mounted at a wide angle to create depth and a sense of perspective in the frame. Zoom in to show the man as the center of the shot: focus on his solitary figure.
– ar 3:2, HQ, -testp,8k, -beta -beta -beta.
Negative Prompt
«Уродливое нереалистичное лицо человека, неестественная поза человека, ужасно смоделированные руки и пальцы, нереалистично нарисованная вода в фонтане, нереалистичные птицы».
Ugly unrealistic human face, unnatural human posture, poorly modeled hands and fingers, unrealistically drawn water in the fountain, unrealistic birds.
В основном промпте мы ввели термин, употребляемый при работе с нейросетью: – ar 3:2. Вы наверняка догадались, что буквы – ar – это не что иное, как сокращение от Aspect Ratio – «формат изображения». И хотя эта функция есть в отдельном поле приложения, но если теперь вы вдруг увидите в сети промпт с такими символами, то будете знать, что они означают.
Еще вы, наверное, заметили, что мы прямо на первом этапе работы ввели специальные символы, характерные для промптов, которые обычно прописывали в конце. Мы это сделали для того, чтобы нейросеть с самого начала принялась улучшать качество снимка и в конце довела его до совершенства.
Рис. 17. Мужчина, кормящий птиц на городской площади
Итак, вот что у меня получилось примерно с двадцатой попытки получить мало-мальски вразумительное изображение при постоянных изменениях и дополнениях в окнах Prompt и Negative Prompt: довольно адекватная (хотя и пустоватая на среднем плане) композиция, анатомически верная фигура сидящего на корточках человека, человеческое (слава богу!) лицо с чертами, не вызывающими ступора. Строение кисти, правда, немного настораживает, ну да ладно, в глаза вроде не сильно бросается, исправим в дальнейшей работе.