ml.
Рекомендательная система для вашего каталога научных работ (и не только!)
Используем обработку естественного языка и теорию графов для сравнения и рекомендации различных типов документов. ВведениеПочти все проекты начинаются с одного важного этапа — активных исследований. Инвестировать в то, что уже было сделано другими, в развитие их работы — это один из путей к повышению ценности вашего проекта. Важно не только извлечь уроки из опыта других, но и понять, чего не стоит делать в своем проекте, чтобы повысить его шансы на успех.
Исследователи T-Bank AI Research разработали метод, показывающий, как модель принимает решения на разных слоях
Исследователи из T‑Bank AI Research представили
Когда обучение не идет. Loss is NaN. Причины и решения
Привет, это моя первая статья на Хабре. И я хочу рассказать вам о проблеме, на решение которой когда-то давно у меня ушло довольно много времени.Часто бывает, что при обучении (или тестировании) модели нейронной сети (NN) функция потерь (loss) возвращает значение NaN (Not a Number). Это приводит к тому, что фаза обучения "срывается". Обычно неясно, почему это происходит. Я расскажу вам о возможных причинах и рекомендациях по решению этой проблемы.Взрыв градиентаСуществует две основные проблемы с градиентами на этапе обучения: исчезновение (vanishing) и взрыв (explosion) градиент. Первая описана в этих статьях:
Как прошла GoCloud 2025 — масштабная IT-конференция про облака и AI. Делимся итогами
Всем привет! Это Петр Предтеченский — архитектор облачной платформы Cloud.ru Evolution и ведущий трека «Инфраструктура и сервисы» на нашей очередной конференции GoCloud 2025, которая состоялась буквально вчера — 10 апреля. Хочу поделиться с вами краткими итогами мероприятия, а еще рассказать про наши новые облачные и AI-сервисы и то, какой масштаб они могут открыть для решения ваших задач. Погнали!
Код, теория и практика: подборка книг по NLP
Привет! Это Никита Малыхин, Tech Lead в команде AdTech в Центре Big Data МТС. В прошлый раз я поделился
Видение концепции Цифровой Двойник в терминах «Индустрии 5.0». Агентный планировщик и симулятор
ВводнаяЕсли разбираться в тонкостях применимости понятия цифровой двойник к разным сущностям от человека до планеты, то любой заинтересованный человек будет активно защищать - применимость, а незаинтересованный скорее всего будет говорить про - неприменимость. Для себя я определил интересные области применимости ЦД, это сущности которые имеют под собой процессы планирования. Вначале попробуем разобраться с терминологией Индустрии 4.0, те самые хайповые определения, в них я не буду затрагивать AR/VR и аддитивные технологии (3д печать) - каждый раз себе представляю человека сидящего в шлеме VR перед 3Д принтером =)
Открыли набор в онлайн-магистратуру «Науки о данных и искусственный интеллект» от Яндекса и НИЯУ МИФИ
Начинается приёмная кампания на двухлетнюю магистерскую программу «Науки о данных и искусственный интеллект», которая стартует в сентябре 2025 года. Программа магистратуры основана на исследованиях рынка и запросах работодателей в 2025 году. Программу разработали эксперты Яндекса и преподаватели НИЯУ МИФИ. Полученные в магистратуре знания и навыки можно сразу применять на практике.
Всё про инференс на Sophon NPU (TPU)
Easter Egg is incomingВ этой статье мы поговорим про ML на базе плат Sophon. Наверное это один из производителей которые набрали больше всего популярнсти в AI последнее время.
Головоломка, кофе и охапка книг, или как я искал истоки термина «Deep Learning». Часть 2
Привет! Некоторое время назад я начал искать истоки термина «Deep Learning». Тогда я изучал только зарубежные источники и обещал вернуться позже с обзором советской и российской литературы. Что ж, откладывать это больше нельзя. Посмотрим, на кого будут ссылаться отечественные авторы в том, что касается истории развития глубокого обучения. Без долгого вступления — берем в руку пальцы Ctrl/Cmd+F и начинаем раскопки!

