Anthropic выкупила, отсканировала и потом уничтожила миллионы физических книг для обучения своего ИИ Claude
Anthropic выкупала и сканировала, а затем уничтожала миллионы физических книг для обучения своих моделей искусственного интеллекта Claude, пишет Ars Technica. Компания извлекала страницы из переплётов печатных книг для сканирования и создания цифровых копий.
Компании спамят Reddit сгенерированными ИИ сообщениями
Платформа Reddit, которая страдает от нашествия ИИ-ботов и веб-сканеров, закрыла им доступ к своим материалам и индексируется только через Google. Однако это привело к тому, что компании начали атаковать соцсеть сгенерированными ИИ сообщениями.
Писатели подали в суд на Microsoft из-за использования их книг для обучения ИИ
Группа писателей подала в суд на Microsoft, обвинив компанию в несанкционированном использовании их книг для обучения своей модели искусственного интеллекта Megatron. Кай Бёрд, Джиа Толентино, Дэниэл Окрент и несколько других авторов утверждают, что пиратские версии их книг помогли ИИ корпорации научиться отвечать на промпты людей.
Федеральный судья встал на сторону Anthropic в судебном процессе об авторском праве
Федеральный судья Уильям Алсап постановил, что компания Anthropic имеет право обучать свои модели ИИ на основе опубликованных книг без разрешения авторов. Это первый случай, когда суды поверили в то, что доктрина добросовестного использования может освободить компании, работающие с ИИ, от ответственности, когда они используют материалы, защищённые авторским правом, для обучения больших языковых моделей.
ChatGPT уже настолько загрязнил Интернет, что это тормозит будущее развитие ИИ
Стремительный рост ChatGPT и целая плеяда последовавших генеративных моделей конкурентов, уже загрязнили интернет таким количеством ненужного хлама, что это тормозит развитие будущих моделей искусственного интеллекта, утверждает издание The Register.
WSJ: китайская компания вывезла в Малайзию жёсткие диски с 80 ТБ данных для обучения ИИ-модели в обход ограничений США
В начале весны 2025 года четыре инженера китайской компании вывезли из Пекина в малайзийский Куала-Лумпур по одному чемодану с 15 жёсткими дисками в каждом. Носители содержали 80 ТБ электронных таблиц, изображений и видео для обучения модели искусственного интеллекта. В малайзийском центре обработки данных работодатель инженеров арендовал около 300 серверов с передовыми чипами Nvidia. Обученную на этих данных модель вывезли обратно в Китай, пишет Wall Street Journal.
Учёные из T‑Bank AI Research разработали метод повышения безопасности и точности ответов ИИ до 15%
Учёные из лаборатории исследований искусственного интеллекта T‑Bank AI Research создали методику обучения больших языковых моделей (LLM). Метод основан на методах Trust Region. По словам учёных, результаты исследования помогают улучшить качество ответов ИИ до 15% по пяти показателям. Исследование представили на конференции по машинному обучению ICLR в Сингапуре. Конференция идёт с 24 по 28 апреля 2025 года.
Баг-репорты в iOS передают контент пользователей для обучения ИИ
В Apple Insider выяснили, что участники программы бета-тестирования iOS должны разрешать использовать их контент для обучения Apple Intelligence. При этом у них нет возможности отказаться от этого.
«Википедия» представила набор данных для обучения ИИ ради борьбы со скрейпингом
«Википедия» пытается решить проблему перегрузки своих серверов из-за агентов ИИ, которые занимаются веб-скрейпингом. Интернет-энциклопедия выпустила набор данных, специально оптимизированный для обучения моделей искусственного интеллекта.

