ml.

Исследователи T-Bank AI Research разработали метод, показывающий, как модель принимает решения на разных слоях

Исследователи из T‑Bank AI Research представили

Оставлено в

Когда обучение не идет. Loss is NaN. Причины и решения

Привет, это моя первая статья на Хабре. И я хочу рассказать вам о проблеме, на решение которой когда-то давно у меня ушло довольно много времени.Часто бывает, что при обучении (или тестировании) модели нейронной сети (NN) функция потерь (loss) возвращает значение NaN (Not a Number). Это приводит к тому, что фаза обучения "срывается". Обычно неясно, почему это происходит. Я расскажу вам о возможных причинах и рекомендациях по решению этой проблемы.Взрыв градиентаСуществует две основные проблемы с градиентами на этапе обучения: исчезновение (vanishing) и взрыв (explosion) градиент. Первая описана в этих статьях:

продолжить чтение

Оставлено в

Как прошла GoCloud 2025 — масштабная IT-конференция про облака и AI. Делимся итогами

Всем привет! Это Петр Предтеченский — архитектор облачной платформы Cloud.ru Evolution и ведущий трека «Инфраструктура и сервисы» на нашей очередной конференции GoCloud 2025, которая состоялась буквально вчера — 10 апреля. Хочу поделиться с вами краткими итогами мероприятия, а еще рассказать про наши новые облачные и AI-сервисы и то, какой масштаб они могут открыть для решения ваших задач. Погнали!

продолжить чтение

Оставлено в

Код, теория и практика: подборка книг по NLP

Привет! Это Никита Малыхин, Tech Lead в команде AdTech в Центре Big Data МТС. В прошлый раз я поделился

продолжить чтение

Оставлено в

Видение концепции Цифровой Двойник в терминах «Индустрии 5.0». Агентный планировщик и симулятор

ВводнаяЕсли разбираться в тонкостях применимости понятия цифровой двойник к разным сущностям от человека до планеты, то любой заинтересованный человек будет активно защищать - применимость, а незаинтересованный скорее всего будет говорить про - неприменимость. Для себя я определил интересные области применимости ЦД, это сущности которые имеют под собой процессы планирования. Вначале попробуем разобраться с терминологией Индустрии 4.0, те самые хайповые определения, в них я не буду затрагивать AR/VR и аддитивные технологии (3д печать) - каждый раз себе представляю человека сидящего в шлеме VR перед 3Д принтером =)

продолжить чтение

Оставлено в

Открыли набор в онлайн-магистратуру «Науки о данных и искусственный интеллект» от Яндекса и НИЯУ МИФИ

Начинается приёмная кампания на двухлетнюю магистерскую программу «Науки о данных и искусственный интеллект», которая стартует в сентябре 2025 года. Программа магистратуры основана на исследованиях рынка и запросах работодателей в 2025 году. Программу разработали эксперты Яндекса и преподаватели НИЯУ МИФИ. Полученные в магистратуре знания и навыки можно сразу применять на практике.

продолжить чтение

Оставлено в

Всё про инференс на Sophon NPU (TPU)

Easter Egg is incomingВ этой статье мы поговорим про ML на базе плат Sophon. Наверное это один из производителей которые набрали больше всего популярнсти в AI последнее время.

продолжить чтение

Оставлено в

Головоломка, кофе и охапка книг, или как я искал истоки термина «Deep Learning». Часть 2

Привет! Некоторое время назад я начал искать истоки термина «Deep Learning». Тогда я изучал только зарубежные источники и обещал вернуться позже с обзором советской и российской литературы. Что ж, откладывать это больше нельзя. Посмотрим, на кого будут ссылаться отечественные авторы в том, что касается истории развития глубокого обучения. Без долгого вступления — берем в руку пальцы Ctrl/Cmd+F и начинаем раскопки!

продолжить чтение

Оставлено в

Магия персональных рекомендаций, или как нейросеть Яндекс Карт подбирает места под интересы пользователей

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

ml.

Рекомендательная система для вашего каталога научных работ (и не только!)

Исследователи T-Bank AI Research разработали метод, показывающий, как модель принимает решения на разных слоях

Когда обучение не идет. Loss is NaN. Причины и решения

Как прошла GoCloud 2025 — масштабная IT-конференция про облака и AI. Делимся итогами

Код, теория и практика: подборка книг по NLP

Видение концепции Цифровой Двойник в терминах «Индустрии 5.0». Агентный планировщик и симулятор

Открыли набор в онлайн-магистратуру «Науки о данных и искусственный интеллект» от Яндекса и НИЯУ МИФИ

Всё про инференс на Sophon NPU (TPU)

Головоломка, кофе и охапка книг, или как я искал истоки термина «Deep Learning». Часть 2

Магия персональных рекомендаций, или как нейросеть Яндекс Карт подбирает места под интересы пользователей

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

ml.