ИИ-дайджест недели

2.png

Иллюзия компетентности: ИИ-агенты провалили тесты на реальной работе

Новое исследование вскрыло шокирующую неэффективность современных ИИ-агентов при выполнении задач, с которыми легко справляются люди-фрилансеры. Тестирование шести ведущих моделей на симулированных проектах из геймдева, анализа данных и других областей показало катастрофические результаты: ни один агент не смог выполнить более 3% работы.
Лидером с минимальным показателем в 2.5% стал агент китайского стартапа Manus. Модели Grok 4 и Claude Sonnet 4.5 показали результат 2.1%, а разрекламированная GPT-5 от OpenAI, позиционируемая как шаг к искусственному общему интеллекту (AGI), справилась лишь с 1.7% задач. Хуже всех проявила себя модель Gemini 2.5 Pro от Google, достигшая всего 0.8%. Эксперты отмечают, что, несмотря на заявления лидеров индустрии, ИИ-агенты лишены долгосрочной памяти и не способны обучаться в процессе работы, как люди, что ставит под сомнение их текущую экономическую ценность.

1.jpg

Энергия для разума: Хуанг предрекает революцию ИИ-инфраструктуры

Генеральный директор Nvidia Дженсен Хуанг, выступая на Computex 2025, заявил, что вычислительные мощности для искусственного интеллекта в скором будущем станут такой же критической инфраструктурой, как электроснабжение или интернет. По его мнению, ИИ станет необходимым в каждой стране, компании и отрасли, что потребует создания гигантских центров обработки данных и мощного оборудования.
Хуанг видит будущее Nvidia не просто как технологической компании, а как создателя фундаментальной инфраструктуры для новой эры. В ходе презентации были продемонстрированы новейшие решения компании, включая стойки с ускорителями GB300 и компактные системы на базе GB10. Этот стратегический взгляд подчеркивает, что развитие ИИ упирается не только в алгоритмы, но и в создание масштабной физической базы для вычислений, где Nvidia намерена играть ключевую роль.

2.jpg

Конструктор креатива: Runway запустила инструмент для сборки рабочих процессов

Платформа для генеративного ИИ Runway представила систему Workflows, которая позволяет пользователям создавать собственные цепочки для генерации контента. Функция, работающая по принципу узлового редактора, дает возможность соединять различные модели и этапы обработки, например, комбинируя генерацию изображения, его правку и последующее создание на его основе видео.
Workflows позволяют сохранять и повторно использовать настроенные пайплайны, что особенно удобно для студий и рекламных агентств, работающих над типовыми проектами. Это стратегический шаг Runway к созданию замкнутой экосистемы, где пользователи могут разрабатывать сложные производственные процессы, не покидая платформу. На данный момент функция доступна корпоративным клиентам и участникам программы Creative Partners, но в скором времени станет доступна и для всех пользователей.

Индустрия ИИ переживает период противоречий: с одной стороны, технологии становятся более сложными и доступными (Runway), а инфраструктура - глобальным приоритетом (Nvidia). С другой - текущие возможности ИИ-агентов сильно отстают от маркетинговых заявлений, что свидетельствует о завышенных ожиданиях и необходимости дальнейшего развития для реального замещения человеческого труда.

67 0 850 3
8
2025-11-07
ждем когда можно будет сделать агента который по одному запросу с тем что нравится будет делать сериал с сюжетом, сеттингом, персонажами, их портретами, вариантами дизайна одежды, локациями. ПОтом будет все имеющееся использовать для генерации кадров и затем уже видео)
2025-11-07
Интересно будет наблюдать, как индустрия от слов перейдёт к делу - когда "инфраструктура для ИИ" будет не просто лозунгом, а базой, на которой можно будет реально что-то строить.
2025-11-08
Алексей Михайлов (Roarhead)ждем когда можно будет сделать агента который по одному запросу с тем что нравится будет делать сериал с сюжетом,
В общем-то это можно сделать уже сейчас. ЧатЖПТ, являясь мультимодальной, способна выполнить полный цикл производства. (кстати, большую часть промтов для SORA2 пишет именно он). Надо только обучить ИИ агента, предоставить доступ к АПИ и настроить под критическую оценку траев.
Единственный минус - SD разрешение и считанные секунды хрона на 1 шот. Качественный 4к без артефактов надо ждать много лет, не меньше пяти, скорее 10. Это при условии, если ИИ-бум к тому времени не загнется.
2025-11-08
"...Генеральный директор Nvidia Дженсен Хуанг, выступая на Computex 2025, заявил, что вычислительные мощности для искусственного интеллекта в скором будущем станут такой же критической инфраструктурой, как электроснабжение или интернет..."

Из этого я понял только то, что обычным пользователям можно уже не мечтать о видеокартах мощнее 5090й и дешевше цены квартиры в центре.
2025-11-08
Александр Р"...Генеральный директор Nvidia Дженсен Хуанг, выступая на Computex 2025, заявил, что вычислительные мощности для искусственного интеллекта в скором будущем станут такой же критической инфраструктурой, как электроснабжение или интернет..."

Из этого я понял только то, что обычным пользователям можно уже не мечтать о видеокартах мощнее 5090й и дешевше цены квартиры в центре.

Истинно так.
Хуанг в очередной раз кукарекнул про важность вычислительных мощностей. И поднял тем самым значимость своей конторы. И стоимость активов.
В интересные времена живём...
2025-11-08
Александр РИз этого я понял только то, что обычным пользователям можно уже не мечтать о видеокартах мощнее 5090й и дешевше цены квартиры в центре.
Так генеральный директор Нвидиа и АМД являются двоюродными братом и сестрой, так что там считай уже какой-то картельный сговор который будет держать цены и развитие в нужном им русле.
2025-11-11
а вот это уже первый большой шаг к разрыву ИИ-пузыря, имею ввиду представленное Исследование. Шутка ли, вложены миллиарды, а на выхлопе 3%, даже не 50% то есть половину задачи выполняет. Но при этом Хуанг: купите у нас еще больше оборудования, тогда может вы выйдете на целых 10%!
2025-11-11
Oleg Vizerа вот это уже первый большой шаг к разрыву ИИ-пузыря, имею ввиду представленное Исследование. Шутка ли, вложены миллиарды, а на выхлопе 3%, даже не 50% то есть половину задачи выполняет. Но при этом Хуанг: купите у нас еще больше оборудования, тогда может вы выйдете на целых 10%!

Сколько десятилетий мы ждем когда лопнет долларовый пузырь с их гос.долгом? Каждый год он почти лопается, но никаких проблем у него нет и не будет. Тоже самое с ИИ, это не краткосрочная перспектива вечером деньги, утром стулья, это вложения в долгосрочную, на многие десятилетия вперед. А потом, когда все остальные проснутся, США в плане ИИ уже будет не догнать и они будут контролировать весь мир еще сильнее.
RENDER.RU