От генерации к рассуждению: эволюция языковых моделей от GPT до RL
АбстракцияВ контексте стремительного развития больших языковых моделей (LLM) особое внимание уделяется повышению их способности к логическим рассуждениям. Одним из значимых достижений в этой области является модель DeepSeek-R1, разработанная для стимулирования reasoning-способностей LLM с помощью методов обучения с подкреплением (Reinforcement Learning, RL). DeepSeek-R1 представляет собой инновационный подход, направленный на улучшение качества генерации ответов в задачах, требующих многошаговых логических выводов.Основные характеристики DeepSeek-R1DeepSeek-R1 относится к классу reasoning-моделей, таких как OpenAI o1/o3,
Нейросети со льдом: как мы разрабатываем методы ИИ для повышения эффективности прогнозирования морского льда в Арктике
Привет, Хабр! Меня зовут Юлия Борисова, я младший научный сотрудник лаборатории композитного искусственного интеллекта и исследовательского центра «Сильный ИИ в промышленности». Одна из задач, которой я занимаюсь вместе с коллегами из ИТМО ― прогнозирование динамики морского льда в Арктике с помощью ИИ.Чтобы успешно осваивать арктический шельф и развивать Северный морской путь, нужны данные о ледовом покрове акватории ― например, важно знать толщину и концентрацию льда и положение кромки. Без этого сложно определить, когда открывать навигацию, на сколько месяцев планировать работу и какой бюджет на нее заложить.

