Поставил на компьютер Stable Diffusion (easydiffusion), выяснилось что ресурсов моего компьютера на это маловато – картинка рисуется по 10 минут. Может позже поставлю на другой компьютер и куплю к нему хорошую видеокарту, тогда должно быть нормально. В Krea же картинка рисуется за полсекунды, прямо удивительно.
Krea рисует вроде не хуже, но сейчас не могу разобраться, как в ней загрузить свою картинку как шаблон для новой (режим img2img). Нажимаю Upload Image слева, выбираю файл и ничего не происходит.
В идеале мне хотелось бы решить такую задачу: нарисовать картину, на которой я (с моим лицом) на коне с мечом атакую дракона. Не знаю пока, нужно ли для этого тренировать собственную модель, загружая много моих фото в разных ракурсах, или же хватит стандартного img2img?
Я был зачарован, играясь с настройками AI strength в krea с режимом img2img: если этот параметр выставить большим, нейросеть нарисует картинку по промпту с минимальным влиянием исходной, а если маленьким – нейросеть перерисует исходную с минимальным влиянием промпта; если же посередине – начитается магия. И никак не могу понять – думает ли нейросеть?
Нашёл ещё одну нейросеть, которая говорит как chatgpt и даёт сгенерировать картинку:
https://you.com
Тут какие-то другие принципы, нельзя задать хитрые настройки из профессиональных арт-нейросетей. Я пока не понял, как у you взаимодействуют нейросети разных уровней, в частности можно ли после прорисовки картинки словами указать поменять в ней что-то конкретное. Нейросеть you даёт нарисовать только три картинки, а дальше требует платную подписку.
Вот мой тест нескольких арт-нейросетей. В Krea набрал промпт a big red frog near a small green mouse, сгенерировал 10 картинок, лучшая вышла такой:

Далее сделал промпт two creatures are near each other, creature A is a big red frog, creature B is a small green mouse, тоже сделал 10 картинок, лучшая получилась такой:

Далее я повторил промпт a big red frog near a small green mouse в easydiffusion на моём компьютере, 10 картинок, лучшая такая:

Повторил второй промпт two creatures are near each other, creature A is a big red frog, creature B is a small green mouse, 10 картинок, лучшая такая:

И напоследок ввёл в you промпт a big red frog near a small green mouse, с первой попытки вышло вот что:

Как видите, последняя нейросеть справилась намного лучше. Но в ней нет этих хитрых настроек, необходимых для профессиональной работы. Мне надо разобраться, что за нейросеть в ней задействована, может Midjourney? Тогда выходит что Midjourney намного круче всех прочих арт-нейросетей.