Самые быстрые алгоритмы распределенного и асинхронного обучения (с точки зрения теории)
Всем привет! Меня зовут Александр Тюрин, я руководитель группы «Методы оптимизации в машинном обучении» в AIRI и старший преподаватель Сколтеха. Мы с коллегами занимаемся оптимизацией распределённого обучения — это довольно актуальная проблема, учитывая, что современные модели обучаются на многих тысячах GPU. За последние 2 года нам удалось сделать несколько открытий в асинхронных методах оптимизации, которые мы изложили в 5 статьях на NeurIPS и ICLR. В этой статье я расскажу, в чём заключаются особенности распределённого обучения и что нового привнесли в него мы с точки зрения теории.
Цифровой вытрезвитель. Решение
На Гитхабе: https://github.com/suprathermal/System-II.На (временном) запасном аэродроме: https://1drv.ms/u/s!Aix7Hvq263uagjTGTAOBM7OTEPpk?e=P9D7VQ. Или сохраняем вот эту картинку, я ниже объясню, как её перекодировать в zip проекта.
Погружение в мир диффузионных моделей — путеводитель для новичков
Диффузионные модели перевернули мир генеративного искусственного интеллекта, вытеснив GAN'ы и вариационные автоэнкодеры. Но как они работают? Чем отличаются друг от друга? И как научиться их использовать?Эта статья — путеводитель для тех, кто хочет разобраться в диффузионных моделях с нуля. В ней вы найдете
ElevenLabs представил автономную модель преобразования речи в текст Scribe
ElevenLabs, стартап в сфере искусственного интеллекта, который только что получил 180 миллионов долларов в рамках мегафинансирования, в первую очередь известен своим мастерством в создании аудио. Компания сделала шаг в другом технологическом направлении, выпустив свою первую автономную модель преобразования речи в текст под названием Scribe.
Умный помощник для корпоративного обучения: опыт внедрения продвинутой RAG-системы в крупной компании
Привет, Хабр! Меня зовут Антон, я занимаюсь внедрением ИИ в компании Doubletapp
Я заставил новую модель Claude 3.7 Sonnet пройти собес по алгоритмам
Недавно в мире GenAI появились захватывающие новости: компания Anthropic представила новую языковую модель Claude 3.7 Sonnet. Эта модель объединяет в себе высокую скорость реакции и способности «глубокого» рассуждения (deep reasoning), что делает её одной из самых универсальных и продвинутых моделей на рынке коммерческих LLM. Благодаря инновационному подходу к гибридноcти, Claude 3.7 Sonnet способна как быстро отвечать на запросы, так и предоставлять подробное пошаговое обоснование своих выводов в зависимости от выбранного режима.Основные особенности Claude 3.7 Sonnet
Amazon представляет новую и улучшенную Alexa+
На мероприятии в Нью-Йорке в среду компания Amazon анонсировала обновлённую версию Alexa — Alexa+ — на основе технологий генеративного искусственного интеллекта. Выступая на сцене, глава подразделения устройств и сервисов Amazon Панос Панай назвал это «полной перестройкой» ИИ-помощника.
xAI расширяет границы возможностей ИИ с новым голосовым режимом Grok 3
Компания Илона Маска, занимающаяся искусственным интеллектом, выпустила голосовую функцию для Grok 3, которая позволяет использовать откровенный контент и выражать «крайние» точки зрения.
Первая ИИ-модель для обучения на тексте
Привет, будущие разработчики! Сегодня я расскажу вам, как создать свою первую модель искусственного интеллекта. Это совсем для начинающих, так что не переживайте — никаких сложных терминов и запутанных выражений. Всё, что понадобится, — ваши идеи и немного кода. Будем писать на Python и использовать TensorFlow — мощную библиотеку от Google для машинного обучения. Почему Python, TensorFlow и как начать работу в Google ColabЕсли спросить, почему так часто для работы над ИИ выбирают Python

