Переобучение нейросети в машинном обучении: что такое переобучение и как его выявить
Доброго времени суток, Хабр!В предыдущей своей статье я рассматривал разные парадигмы обучения моделей. Однако не всегда при обучении все происходит гладко.Бывают ситуации, когда на обучающих данных модель работает идеально, но при проверке на новых данных точность резко снижается. Это явление называется переобучением.Сегодня в статье расскажу об переобучении моделей, как обнаружить это явление и избежать его. Примите стратегически удобное положения, а я приступаю к своему повествованию.
ИИ в промышленном IT: где заканчивается хайп и начинается измеримый эффект
В этом обзоре мы собрали ключевые идеи и практические инсайты из серии подкастов, записанных на конференции Industrial++. С руководителями AI- и IT-направлений из крупных промышленных компаний на мероприятии пообщались Василий Саутин, коммерческий директор платформы «Сфера» (ИТ-холдинг Т1) и его коллега, директор по продуктам платформы «Сфера», Сергей Полиненко.
Как деанонимизировать поведение трансформера на временных рядах: визуальная диагностика и фальсифицируемые тесты
TL;DR: ниже я показываю метод интерпретации трансформероподобной модели на временных рядах, который работает как инструмент дебага с интервенционным протоколом, а не как банальная визуализация. Метод строит карту вклада входных сигналов в координатах время × масштаб × признак, и я проверяю ее через два фальсифицируемых теста: (1) подмену ключевых входных каналов на статистически правдоподобные суррогаты и (2) режимный контраст на естественной смене состояния входа. Цель — не пост-фактум проиллюстрировать веса конкретной предобученной нейросети, а
Возможно, именно использование вайб-кодинга стало причиной роста числа новых iOS-приложений
Данные Sensor Tower и Wells Fargo Securities свидетельствуют о том, что инструменты для разработки приложений с использованием ИИ наводняют iOS App Store. По данным
Компания Anthropic переписала правила Claude
Компания Anthropic выпустила переработанную версию основополагающего документа, определяющего ценности и поведение Claude. Эта конституция объемом в 10 000 слов написана в первую очередь для самого ИИ и открыто затрагивает вопросы о возможном наличии сознания.
Исследование Apple: управляемость ИИ зависит от задачи
Новое исследование показало, что управлять языковыми и генеративными AI-моделями сложнее, чем кажется. Эффективность таких моделей зависит от конкретной задачи, самого алгоритма и использованного запроса.
Google узаконила ИИ-кликбейт
В начале декабря авторитетный ресурс The Verge пожаловался

