OpenAI представила масштабное обновление ChatGPT, добавив функцию генерации изображений на основе инновационной мультимодальной модели GPT-4o. Теперь пользователи могут легко создавать и редактировать картинки прямо в чате - быстро, удобно и без переключения между сервисами.
Функция получила название 4o Image Generation (Images in ChatGPT) и предлагает более глубокое понимание контекста, а также точную интерпретацию сложных запросов. По сравнению с DALL·E 3, GPT-4o значительно лучше связывает атрибуты с объектами и корректно обрабатывает даже многосоставные сцены. "Раньше модели допускали ошибки в цветах и формах даже при работе с 5–8 объектами, но GPT-4o уверенно обрабатывает до 15–20 элементов. Кроме того, новая система значительно лучше генерирует читаемый текст на изображениях - это решает одну из ключевых проблем предыдущих версий.
Разработчики использовали авто регрессивный метод генерации: изображение формируется последовательно, слева направо и сверху вниз. В отличие от
диффузионного подхода DALL-E, где картинка создаётся целиком, это позволяет точнее контролировать детали - особенно текст и сложные композиции.
4o Image Generation не только создаёт изображения с нуля, но и позволяет редактировать загруженные файлы: добавлять или удалять объекты по
текстовому запросу. Отдельно улучшена работа с прозрачным фоном - теперь проще создавать логотипы, стикеры и UI-элементы.
Многие пользователи, после обновления, начали массово превращать известные фотографии, в работы студии Gibli.
Также ChatGPT научился делать мангу по вашему описанию.
Отмечается, что Каждое сгенерированное изображение будет снабжено метаданными C2PA, подтверждающими его искусственное происхождение. Система автоматически блокирует создание дипфейков, контента с насилием и материалами, связанными с детской эксплуатацией. Разработчики особо отметили усиленные меры защиты, направленные в первую очередь против злоупотреблений технологией дипфейков. OpenAI внедрила скрытую систему идентификации изображений. Несмотря на отсутствие визуальных водяных знаков, компания располагает технологиями для определения происхождения контента.
Политика защиты авторских прав включает:
- Форму запроса на исключение произведений из обучающей базы
- Возможность запрета сбора данных с указанных веб-ресурсов
Условия доступа к 4o Image Generation:
- Доступно всем пользователям ChatGPT (включая бесплатный тариф)
- Лимит: 3 изображения в день (аналогично DALL·E 3)
Это обновление не только расширяет возможности ChatGPT, но и задаёт новые стандарты в области ответственного использования генеративного ИИ.
Ах да, пожалуй самое главное, теперь можно сгенерировать бокал, наполненный до краёв!
P.S стало известно, что функция генерации картинок для бесплатных пользователей отключили, поскольку она стала слишком популярной, теперь требуется заплатить 20 долларов.