обучение с подкреплением.

«Мозг в пробирке» и новая вычислительная парадигма: почему нейроморфные системы и биокомпьютеры уже не фантастика

Когда в медиа появилась

продолжить чтение

Математическое программирование vs RL: может ли ИИ догнать классику в оптимизации?

продолжить чтение

Ацетилхолин определяет роль дофамина

На протяжении десятилетий нейробиологи пытались объяснить, как один нейромедиатор, дофамин, может одновременно выполнять две совершенно разные задачи. С одной стороны, он подкрепляет обучение, основанное на вознаграждении. С другой – запускает физическую активность. Новое исследование проливает свет на переключатель функций дофамина.

продолжить чтение

Нам не подошла ни одна среда для MARL в непрерывном пространстве — поэтому мы сделали CAMAR

Представьте задачу: есть куча роботов, и им всем надо куда‑то добраться, не столкнувшись с собратьями, а мы должны придумать для этого алгоритм. Это, если упрощать, и называется многоагентным планированием или MAPF — Multi‑Agent Pathfinding. 

продолжить чтение

А если агенту не платить? Альтернативная механика обучения с подкреплением

продолжить чтение

От дашбордов к дофамину: как мозг измеряет эффективность поведения

"Симпсоны", сезон 12, серия 9 "HOMR" (2001) В предыдущих статьях мы разбирались, как измеряют эффективность в менеджменте и на производстве. Количество, скорость, стабильность, глубина. Разные эпохи, разные метрики.

продолжить чтение

Обучение ИИ в 2026 году: Как обучаются современные модели?

Доброго времени суток, «Хабр»!Вы когда-нибудь задумывались, что такое машинное обучение и как оно вообще учится? Чем это может отличаться от обычного программирования с его главным правилом: не трогай, пока работает? Где заканчивается простой код и где он переходит во что-то более мощное - в ИИ-модели, которые мы используем сегодня.Сегодня мы разберем основы ИИ - обучение моделей. Посмотрим какие способы обучения бывают, зачем их применяют и как они показывают, на что модель способна.Принимайте стратегически удобное положение, ну а я перехожу к своему повествованию.

продолжить чтение

Кубик Рубика как универсальная среда для исследования интеллекта

Кубик Рубика давно перестал быть просто головоломкой. Его используют как метафору сложных систем без очевидных решений – от политики и управления до социальных процессов и человеческого интеллекта. Уже более полувека этот простой на вид объект остается символом задачи, требующей анализа, терпения и системного мышления.Почти сразу после своего появления кубик Рубика привлек внимание пионеров ИИ. Уже в начале 1980-х математики и программисты увидели в нем идеальный формализованный дискретный мир: со строгими правилами и гигантским пространством поиска.

продолжить чтение

TSP трансформеры

Трансформеры — это больше, чем кажется на первый взглядВозможно кто-то догадался, что заголовок выше — это перевод первых строк темы из ламповых сюжетов мульсериала 80-х:The TransformersMore than meets the eye

продолжить чтение

Инженеры из Disney Research Hub рассказали, как создавали робоверсию снеговика Олафа из мультфильма «Холодное сердце»

Инженеры из Disney Research Hub показали процесс создания

продолжить чтение

123