Оптимизация нейронных сетей для AI — переводчика
Всем привет! Меня зовут Алексей Рудак, и я – основатель компании Lingvanex, которая уже 8 лет занимается решениями в области машинного перевода и транскрипции речи. В этой статье рассматриваются несколько подходов, которые помогают повысить эффективность и качество языковых моделей для перевода. В качестве основы для тренировки моделей мы используем OpenNMT-tf.
Как алгоритм Recovering Difference Softmax (RDS) делает рекомендации и уведомления точнее и эффективнее
Привет, чемпионы! Алгоритм Recovering Difference Softmax (RDS) – это не просто очередной
NEAT. Основы
ВведениеСегодня "теорию" NEAT, который появился в далёком 2004-м году, но при этом остается мейнстримом среди нейроэволюционных алгоритмов. Мы разберём классический вариант, так как это основа и все остальные варианты(CoDeepNEAT, HyperNEAT и т.д.) будут намного сложнее в имплементации, то есть шанс применить за разумное время обычному человеку очень мал и понять их без изначального варианта представляется почти невозможным.NEAT - алгоритм расширяющихся топологий, то есть может развивать не только веса, но и саму структуру
AI-агенты, RAG, вызовы vibe coding и новая эра кибербезопасности – 35+ докладов про genAI на Conversations 26-27 июня
Конференция по генеративному и разговорному AI Conversations отправляется в Санкт-Петербург! 2 дня, 4 трека, 40+ докладов, дискуссии, нетворкинг и вечеринка – всё это ждет участников Conversations 26 и 27 июня 2025 года.
Подборка для ML-инженера: как прокачаться джуниору
Привет! Меня зовут Антон Моргунов, я инженер МО в «Базис.Центре» и программный эксперт курса «Инженер машинного обучения» в Яндекс Практикуме. В этой статье я поделюсь бесплатными мини-курсами, учебниками, книгами и ресурсами, которые помогут прокачаться в профессии или даже войти в неё с нуля.«Учебник по машинному обучению», Яндекс Образование
Как Duolingo юзает машинное обучение для прокачки английского: кратко и по делу
Привет, чемпионы! Duolingo — это уже давно не просто приложение с разноцветными совами и скучными заданиями. С 2023 года и особенно в 2025-м они вкатились в тему искусственного интеллекта (ИИ) и машинного обучения (ML) по полной. Всё, что раньше делали люди — создание курсов, проверку ответов, адаптацию заданий — теперь почти полностью берёт на себя ИИ. Вот как это работает и почему это круто.
Юнит тесты роя агентов
Исходный код, разобранный в статье, опубликован в этом репозиторииПри разработке роя агентов встает вопрос юнит тестирования. Рой агентов позволяет использовать разные LLM с выбором другой активной модели исходя из действий пользователя. Как следствие, обрабатывать идентичную переписку может любой агент из роя, например, был сделан Redis FLUSHALL и активный агент потерялся: чат продолжается с корневого Triage agent
Как мы в Авито предсказываем категории объявлений по описанию
Привет! Меня зовут Руслан Гилязев, я работаю в подразделении DS SWAT в Авито, руковожу командой платформы Item2param. Одна из моих задач — развивать модели, которые предсказывают параметры объявлений. В этой статье расскажу, с помощью каких технологий мы решаем задачу классификации объявлений и почему это важно для бизнеса. Материал будет полезен DS-инженерам любого грейда и backend-инженерам, которые интересуются темой Data Science.
Обзор техник RAG: Retrieval Augmented Generation
Рассмотрим техники построения и улучшения RAG систем: от нарезания текстов на куски, до продвинутых способов улучшения качества ответа.Этим блогом можно пользоваться как шпаргалкой для проектирования своего RAG-а и/или для подготовки к собеседованиям.Все полезные ссылки и материалы, на которые я опирался будут в конце.Что такое RAG и зачем нуженRAG - это фреймворк взаимодействия предобученной LLM с базой знаний. То есть при ответе LLM на запрос пользователя модель отвечает используя актуальный контекст из базы и свои pre-trained знания.
Запуск ML-экспериментов через ClearML
Привет, товарищи! В предыдущем посте я рассказывал, зачем нужен менеджер ML-экспериментов, поговорили про базовый функционал ClearML. А теперь мы рассмотрим, как можно создавать эксперименты, их настраивать, ставить в очередь и запускать прям из веб-браузера. Кроме того, возникает необходимость автоматически обучать/переобучать модель по расписанию. Для того, чтобы это осуществить в ClearML существуют 2 ключевых концепта:Воркеры и очередиДля запуска эксперимента по обучению или тестированию его нужно сначала поставить в очередь

