GPT-4o - более дешёвая и быстрая версия известной ИИ модели

2.png

GPT-4o, который был анонсирован OpenAI - это более быстрая и дешёвая версия модели искусственного интеллекта, которая лежит в основе её чат-бота ChatGPT. Буква «о» в названии GPT-4o означает omni (всесторонний), что указывает на мультимодальность GPT-4o. GPT-4o новая мультимодальная языковая модель, знаменующая собой большой шаг вперёд в области взаимодействия человека и компьютера.

Среди главных особенностей представленной GPT-4o можно отметить:
- Скорость реакции на аудио-вход сравнима с человеческой (в среднем 320 мс),
- Соответствие производительности GPT-4 Turbo на английском языке и в программировании,
- Значительно улучшенную работу с текстом на других языках,
- В 2 раза быстрее и на 50% дешевле в API по сравнению с GPT-4 Turbo,
- Превосходство над существующими моделями в понимании изображений и аудио.

Сообщается, что GPT-4o будут поэтапно внедряться в ChatGPT, начиная с поддержки ввода текста и изображений. Модель будет доступна "бесплатным" пользователям, а подписчики Plus получат до 5 раз больший лимит сообщений. В ближайшие недели в ChatGPT Plus также появится альфа-версия нового голосового режима на базе GPT-4o. В дальнейшем возможности модели будут расширяться. Учитывая нынешние возможности GPT-4o, которая позволяет, например, переводить сфотографированное меню на другой язык, то в будущем с её помощью ChatGPT сможет «смотреть» спортивную игру в прямом эфире и объяснять вам правила.

В настоящее время поддержка голосового общения не включена в API GPT-4o для всех клиентов. OpenAI пояснила, что из-за риска неправильного использования планирует впервые запустить в ближайшие недели поддержку новых аудиовозможностей GPT-4o для «небольшой группы доверенных партнёров».

0
RENDER.RU