а потом что ты вот советуешь.
Если из бесплатных, которые ставятся на домашний комп и не имеют ограничений по количеству генераций, то на сегодня вроде как представленный выше image_z_image_turbo и является лучшим. Но, как оказалось, он имеет ограничения по возможностям. т.е. для прям совсем профессиональной деятельности он скорее всего не годится (как и все остальные которые ставятся на комп в среду ComfyUI). Ну и пока для него нет аналогов специально обученных под конкретную задачу блоков LORA которые есть в большом количестве для разных вариантов Stable Diffusion работающей на домашнем компе в той же среде ComfyUI. И которые очень упрощают работу. Из самих вариантов Stable Diffusion для ComfyUI наиболее популярен вариант "Juggernaut".
Так же популярны системы на Flex AI. Но image_z_image_turbo заметно превосходит их все по качеству и точности.
Это все для среды ComfyUI. Т.е. это все бесплатно и без ограничений по количеству генераций.
А из платных Нано Банано, опять же вроде как, считается лучшим. QWEN еще считается неплохим. С ними уже можно работать профессионально. Но за деньги.
Кстати, придуманный тут тест на генерацию изображения "Коленчатого вала для 4-х цилиндрового двигателя внутреннего сгорания" не прошел ни один ИИ. Ни Банано, ни QWEN, ни бесплатные ИИ. Лучшие из них делают в целом довольно похоже, но все равно неправильно если понимать что такое коленчатый вал. Другие же вообще делают не пойми чего. Т.е. даже лучшие генераторы изображений при всей их осведомленности о том и о сем, понятия не имеют о конструкции двигателей. И скорее всего это касается не только двигателей.
Впрочем надо попробовать сгенерировать изображение коленчатого вала по промту написанному другим ИИ. Может у него получится правильно и подробно описать коленчатый вал, что бы генератор изображений исходил не просто из понятия "коленчатый вал", а из его очень подробного описания. Это я еще не пробовал. Правда это может получится только в случае, если текстовый ИИ сам знает про коленчатый и вал и понимает что это. Что не факт.
так получилось в Банано 2
Визуально получилось безусловно лучше чем у image_z_image_turbo, но во первых фигура не в полный рост как указано в промте, во вторых слишком много ненужных украшений в виде каких то шестеренок, в третьих книжные шкафы вовсе не из викторианской эпохи. Но все это легко исправляется корректировкой промта. Если денег не жалко, конечно. Там, по моему, бесплатно можно сделать только несколько картинок, три вроде как. Дальше надо платить. А так да, у Банано получилось очень достойно, еще немного и от реальной фотки будет не отличить.
У меня знакомые преподающие в МАРХИ говорят, что сейчас многие студенты как раз этим Банано активно пользуются. В основном для визуализации проектов. В 3д делают голый интерьер, рендерят с него нужные ракурсы и потом эти рендеры насыщают антуражом и раскрашивают в Банано. Как я понимаю, это за деньги. Так же там же делают и концепции проектов. Но вот для проф. работы в архитектуре, где требуется исключительные точность и конкретика, эти ИИ пока что не очень годятся. Только для учебных проектов от которых не требуется ни конкретика, ни какая то особая точность. Или для небольшой быстрой корректировки визуализации проф. проектов - типа здесь посадить человечка, там поставить горшок с цветком, а тут убрать стул на переднем плане, или покрасить стены в другой цвет и т.п. по мелочи, т.е. довести картинку до ума если не удалось это сразу сделать в 3Д.