Почему +0.3% к ROC‑AUC почти всегда шум, и как это проверить
Вы поменяли набор признаков, прогнали кросс‑валидацию, ROC‑AUC вырос с 0.871 до 0.874. Изменение уезжает в продакшен как улучшение, в чате ставят плюсы, через месяц на свежих данных «улучшенная» модель работает не лучше прежней, а иногда хуже. Прирост на третьем знаке утонул в шуме самой процедуры валидации, и отличить его от настоящего сдвига по одному числу было нельзя с самого начала.
СМИ: «VK закупает 1,2 тысячи MacBook и ТВ‑оборудование для разработки „VK Видео“, Max и тестирования сервисов»
Холдинг VK в июне 2026 года запустил масштабные закупки техники для обновления оборудования и тестирования собственных продуктов. Речь идёт о поставках для ООО «ВК», ООО «Единое видео» и ООО «Мах», которые развивают видеоплатформу и мессенджер Max. На эти проекты в 2025 году было выделено 40 млрд рублей государственных средств. Об этом сообщило издание Cnews со ссылкой на данные с площадки «Росэлторг».
LLM, персональные данные и 152-ФЗ
Зачем это вообщеLLM и агенты по типу Codex, Claude Code и т.д. изначально задумывались и использовались для работы с кодом.
«Чёрная дыра» в вашем сознании заставляет вас видеть уникальную версию реальности, утверждают нейробиологи
Мы не наблюдаем за развитием одних и тех же событий в мире — каждый из нас постоянно обновляет свою личную «симуляцию» происходящего
Почему портал самообслуживания не работает — и при чём тут когнитивная нагрузка
Пощадите пользователей
LLM собрала IndexedDB с нуля: 1208 тестов, SQLite и несколько неприятных сюрпризов
TL;DR: одним промптом я реализовал IndexedDB с помощью Claude Code и Ralph loop: получилось пройти 95% целевого подмножества Web Platform Tests и 77,4% более строгого набора тестов.Когда я узнал, что два простых браузерных движка были написаны с помощью вайб-кодинга, я не особенно удивился. Браузерный движок — хорошо изученная задача с несколькими независимыми реализациями, а их кодовые базы наверняка давно попали в обучающие данные LLM.Удивило меня другое: похоже, ни один из проектов по-настоящему не использовал Web Platform Tests
Кто такие AI-мошенники и почему им удается обманывать даже огромные корпорации?
Привет, Хабр! Несу вам забавную историю в духе нашего AI-времени. Один из самых хайповых ИИ-стартапов последнего времени – Builder.ai – рухнул, окончательно и бесповоротно. Интересна ситуация не только раскрученным статусом сего предприятия, но и тем, что Builder смог привлечь внушительную сумму денег на развитие – аж $450 млн, и $30 млн из них – от Microsoft.В чем причины краха и как IT-гиганта обманули полторы тысячи индусов с клавиатурами? Разбираемся в этой захватывающей истории, смотрим на рынок «ИИ-пустышек» и обсуждаем все это с экспертом OXYGEN Андреем Вахутинским.Что произошло
SpaceX купила за $60 млрд стартап Anysphere — разработчика ИИ-ассистента для программистов Cursor
Космическая компания SpaceX купила за $60 млрд стартап Anysphere, который разработал ассистента на искусственном интеллекте Cursor. За счёт приобретения компания Илона Маска стремится расширить своё присутствие на рынке корпоративного ИИ, пишет Reuters. Anysphere работает под торговой маркой Cursor.
