машинное+обучение. - страница 2

Поиск черной кошки в 2000-мерной темной комнате. Турнир алгоритмов машинного обучения

ЭпиграфЭксперимент завершен. Результаты выглядят так, будто я немного сломал законы физики привычного табличного ML.Может быть это соревнование, которого не должно было быть?Это приглашение к репликации.Спрятать иголку в стоге сена? Да!Добро пожаловать на мой маленький тестовый полигон.

продолжить чтение

Mythos все-таки стала инструментом для наступательных киберопераций США

АНБ США начало применять модель Mythos для взлома зарубежных сетей, предположительно в Китае и Иране. Для адаптации системы под задачи спецслужбы Anthropic направила в агентство команду из 6 инженеров.Сотрудничество с АНБ стало исключением на фоне конфликта стартапа с Пентагоном. В правилах безопасности Anthropic жесткие ограничения на военное использование ИИ касаются слежки за гражданами США, но формально оставляют спецслужбам свободу действий в операциях против зарубежных целей.Степень вовлеченности разработчиков Anthropic в активные фазы атак не раскрывается.

продолжить чтение

Трафик ботов и ИИ-агентов впервые превысил активность людей

По данным Cloudflare, доля машинного веб-трафика достигла 57,5%, превысив активность людей (42,5%). По словам гендиректора компании Мэттью Принса, рубеж пройден на несколько лет раньше прогнозируемого 2027 года.Рост обусловлен не классическими скриптами (краулеры, спам, DDoS-сети), а автономными ИИ-агентами. Алгоритмы парсят контент для обучения нейросетей и выполняют многошаговые задачи от лица пользователей: мониторят цены, взаимодействуют со службами поддержки и оформляют заказы.

продолжить чтение

Ideogram релизнул четвертую версию T2i модели

Ideogram 4.0 получила поддержку разрешения 2K, создание прозрачного фона и позиционирование объектов через bounding boxes. Сохранен фокус на качественном рендеринге текста для логотипов и постеров.На DesignArena, модель заняла 1 место среди открытых решений, уступив только проприетарным системам OpenAI и Google.Код (https://github.com/ideogram-oss/ideogram4) и веса (https://huggingface.co/collections/ideogram-ai/ideogram-4) опубликованы в открытом доступе. Для коммерческого применения требуется покупка платной лицензии.

продолжить чтение

️ Anthropic разобрала 832 аккаунта, заблокированных за вредоносную активность с марта 2025 по март 2026 года

ИИ всё чаще используют не для банального фишинга, а для сложных этапов атаки уже внутри взломанной сети.Чаще всего модели применяли для подготовки:• 560 из 832 аккаунтов писали вредоносный код с помощью ИИ • 54 аккаунта использовали ИИ для горизонтального перемещения внутри скомпрометированной сети • доля атакующих среднего риска и выше выросла с 33% до 56% за годИИ-фишинг просел, а использование моделей для поиска учёток, навигации по сети и постэксплуатации выросло. То, что раньше требовало сильной технической подготовки, теперь частично делает агент.

продолжить чтение

Anthropic обнулила лимиты после сбоя в Claude Code

Компания сообщила (https://x.com/ClaudeDevs/status/2061501787769893055), что полностью сбросила пятичасовой и недельный лимиты для всех подписчиков тарифов Pro и Max.Это решение должно компенсировать платным пользователям повышенный расход ресурсов, вызванный программным сбоем.Причиной проблемы стало то, что некоторые сессии Claude Code ошибочно запускали большое число параллельных субагентов. Из-за этого квоты расходовались заметно быстрее, чем предполагалось.

продолжить чтение

Параллельность RNN?

Смотрели итоги прошедшего ICLR? Меня заинтересовала довольно провокационная, на первый взгляд, статья от Эплов — ParaRNN. Казалось бы, параллельность РНН — это их главный недостаток, благодаря которому их заменили трансформеры (в большинстве задач).Так вот, давайте разберемся со всем, на максимально низком уровне, если знаете, что такое RNN и производная — то эта статья для вас.1. Алгоритм DEERDEER = Deep Equilibrium Evaluation of Recurrence (Lim et al., 2024). Базовый алгоритм, на котором строится ParaRNN.1.1. Постановка как задача нахождения корня

продолжить чтение

Nemotron 3 Ultra стала самой мощной открытой моделью из США

**Nvidia анонсировала открытую MoE-модель Nemotron 3 Ultra с архитектурой на 550 млрд параметров, из которых 55 млрд активны при генерации.По оценке Artificial Analysis, модель обошла Gemma 4 и gpt-oss-120b. Выше в рейтинге остаются китайская Kimi K2.6 и закрытые флагманы уровня Opus 4.8.Скорость Nemotron 3 Ultra при тестировании через провайдера DeepInfra превышает 300 токенов в секунду. Открытые модели сопоставимого размера от DeepSeek и Moonshot генерируют 50–100 токенов. Релиз на Hugging Face, OpenRouter и других площадках запланирован на 4 июня. Artificial Analysis в сети Х:

продолжить чтение

Как глушить нефтяную скважину… машинным обучением. Часть 1

продолжить чтение

Математика больших чисел: из игры с нулевой суммой в игру с растущей суммой

Исходный код, разобранный в статье, опубликован в этом репозитории.

продолжить чтение