Nvidia в суде: 500 терабайт пиратских книг легли в основу ИИ компании
Согласно новым судебным документам, поданным авторами в середине января 2026 года, сотрудники Nvidia напрямую запрашивали и получили доступ к гигантскому архиву пиратского контента для обучения нейросетей. Речь идет о 500 терабайтах данных, содержащих миллионы книг, защищенных авторским правом.
Истцы предоставили переписку, в которой сотрудникам Nvidia прямо сообщалось, что репозиторий Anna's Archive (Архив Анны), к которому они обращались, является пиратским хранилищем. Несмотря на это предупреждение, руководство компании дало "зеленый свет" на использование этих данных. Anna's Archive, позиционирующая себя как крупнейшая открытая библиотека, агрегирует контент с известных пиратских плаформ, таких как LibGen, Sci-Hub и Z-Library.
В иске утверждается, что помимо Anna's Archive, Nvidia также использовала другие спорные источники, включая датасет Books3. Загрузив эти коллекции, компания, по версии авторов, создала незаконные копии произведений.
Это уже не первая подобная претензия к Nvidia: первый иск от авторов был подан еще в 2024 году. Новая жалоба значительно расширяет масштаб обвинений, указывая на осознанное и систематическое использование пиратских материалов.
В своей защите Nvidia ранее заявляла, что обучение ИИ не подпадает под традиционные законы об авторском праве, так как модели не "читают" книги, а анализируют в них статистические закономерности. Компания пока не прокомментировала новые обвинения, изложенные в последних документах.
Хотя документально не подтверждено, что эти данные действительно были использованы в продуктах Nvidia, судебное расследование продолжается, и иск может оказать значительное влияние на отношения компании с авторским правом и авторским сообществом.