ИИ-дайджест недели
Иллюзия компетентности: ИИ-агенты провалили тесты на реальной работе
Новое исследование вскрыло шокирующую неэффективность современных ИИ-агентов при выполнении задач, с которыми легко справляются люди-фрилансеры. Тестирование шести ведущих моделей на симулированных проектах из геймдева, анализа данных и других областей показало катастрофические результаты: ни один агент не смог выполнить более 3% работы.
Лидером с минимальным показателем в 2.5% стал агент китайского стартапа Manus. Модели Grok 4 и Claude Sonnet 4.5 показали результат 2.1%, а разрекламированная GPT-5 от OpenAI, позиционируемая как шаг к искусственному общему интеллекту (AGI), справилась лишь с 1.7% задач. Хуже всех проявила себя модель Gemini 2.5 Pro от Google, достигшая всего 0.8%. Эксперты отмечают, что, несмотря на заявления лидеров индустрии, ИИ-агенты лишены долгосрочной памяти и не способны обучаться в процессе работы, как люди, что ставит под сомнение их текущую экономическую ценность.
Энергия для разума: Хуанг предрекает революцию ИИ-инфраструктуры
Генеральный директор Nvidia Дженсен Хуанг, выступая на Computex 2025, заявил, что вычислительные мощности для искусственного интеллекта в скором будущем станут такой же критической инфраструктурой, как электроснабжение или интернет. По его мнению, ИИ станет необходимым в каждой стране, компании и отрасли, что потребует создания гигантских центров обработки данных и мощного оборудования.
Хуанг видит будущее Nvidia не просто как технологической компании, а как создателя фундаментальной инфраструктуры для новой эры. В ходе презентации были продемонстрированы новейшие решения компании, включая стойки с ускорителями GB300 и компактные системы на базе GB10. Этот стратегический взгляд подчеркивает, что развитие ИИ упирается не только в алгоритмы, но и в создание масштабной физической базы для вычислений, где Nvidia намерена играть ключевую роль.
Конструктор креатива: Runway запустила инструмент для сборки рабочих процессов
Платформа для генеративного ИИ Runway представила систему Workflows, которая позволяет пользователям создавать собственные цепочки для генерации контента. Функция, работающая по принципу узлового редактора, дает возможность соединять различные модели и этапы обработки, например, комбинируя генерацию изображения, его правку и последующее создание на его основе видео.
Workflows позволяют сохранять и повторно использовать настроенные пайплайны, что особенно удобно для студий и рекламных агентств, работающих над типовыми проектами. Это стратегический шаг Runway к созданию замкнутой экосистемы, где пользователи могут разрабатывать сложные производственные процессы, не покидая платформу. На данный момент функция доступна корпоративным клиентам и участникам программы Creative Partners, но в скором времени станет доступна и для всех пользователей.
Индустрия ИИ переживает период противоречий: с одной стороны, технологии становятся более сложными и доступными (Runway), а инфраструктура - глобальным приоритетом (Nvidia). С другой - текущие возможности ИИ-агентов сильно отстают от маркетинговых заявлений, что свидетельствует о завышенных ожиданиях и необходимости дальнейшего развития для реального замещения человеческого труда.