Юридическая компания Clarkson обратилась в федеральный суд северного округа Калифорнии с коллективным иском против OpenAI, разработчика популярного ИИ-бота ChatGPT. Заявитель считает, что разработчик нарушил права миллионов интернет-пользователей, используя их публично доступные данные для обучения больших языковых моделей, которые являются основой ИИ-алгоритмов.
Источник изображения: Pixabay
По словам управляющего партнёра Clarkson Райана Кларксона (Ryan Clarkson), компания хочет представлять в суде интересы «реальных людей, чьи данные были украдены и незаконно присвоены для создания этой очень мощной технологии». Согласно имеющимся сведениям, речь идёт об общедоступных данных пользователей, таких как комментарии в социальных сетях, сообщения в блогах, статьи в «Википедии» и др. Официальные представители OpenAI пока воздерживаются от комментариев по данному вопросу.
Судебный иск Clarkson затрагивает главную нерешённую проблему в сфере генеративных нейросетей, таких как ИИ-боты и генераторы изображений. Такие инструменты обучаются на огромном количестве данных, доступных в интернете. После завершения обучения большие языковые модели могут формировать ответы при общении с человеком, сочинять стихи или рассказы, вести сложные беседы и др. Однако люди, чьи данные используются при обучении нейросетей, не давали согласия на использование этой информации кем-то вроде OpenAI.
«Вся эта информация используется масштабно, хотя она никогда не предназначалась для обучения больших языковых моделей», — заявил Кларксон. Он также рассчитывает, что суд установит определённые ограничения в плане того, как могут обучаться ИИ-алгоритмы, и как люди могут получить компенсацию за использование их данных. По данным источника, у компании уже есть группа истцов, и она активно ищет новых клиентов.
Иск Clarkson к OpenAI является не первым случаем, когда разработчиков ИИ-алгоритмов обвиняют в незаконном использовании данных. В ноябре прошлого года был подан иск против OpenAI и Microsoft в связи с тем, что компании использовали программный код на платформе GitHub для обучения ИИ-инструментов. В феврале платформа Getty Images подала в суд на Stability AI, обвинив компанию в незаконном использовании изображений сервиса для обучения своей генеративной нейросети.
Источник:
3DNews