ai. - страница 53

ai.

Умный Learning Rate Scheduler: Управляем скоростью обучения, анализируя ускорение

Мы привыкли использовать ReduceLROnPlateau если val_loss не улучшается N эпох подряд - режем learning_rate. Это работает. Мы ждем, пока обучение врежется в стену, и только потом реагируем.А что, если мы могли бы увидеть эту стену заранее? Что, если бы мы могли сбросить скорость плавно, еще на подходе к плато, и снова нажать на газ, если впереди откроется новый спуск?Я хочу поделиться концепцией умного LR шедулера, который управляет скоростью обучения, анализируя не сам loss, а скорость его изменения.Проблема ReduceLROnPlateau: Мы реагируем на симптом, а не на причину

продолжить чтение

Построение инфраструктуры AI-агентов: три пути от хаоса к масштабируемым системам

Наш опыт работы с клиентом, которому мы помогли превратить один большой AI-монорепозиторий в структурированную экосистему агентов, инструментов и регистров.

продолжить чтение

Пока ИИ обещает снять нагрузку, его разработчики пашут до 100 часов в неделю

Ведущие издания США пишут

продолжить чтение

Ant Group представила исследование об обучении триллионных reasoning-моделей

продолжить чтение

Учёные представили метод, который ускоряет self-attention до 4.4×

Новая архитектура Adamas предлагает радикальное ускорение механизма внимания до 4.4× быстрее, при сохранении качества даже на длинных контекстах (100k+ токенов).

продолжить чтение

Трамп помиловал основателя Binance

Бывший CEO Binance Чанпэн Чжао, известный как CZ, получил официальное помилование от Дональда Трампа, сообщает The Wall Street Journal.

продолжить чтение

OpenAI покупает разработчиков ИИ-ассистента для Mac

OpenAI объявила о приобретении Software Applications Incorporated, разработчиков Sky — интеллектуального интерфейса для macOS, который буквально живёт поверх всех окон и приложений.

продолжить чтение

Очередь промтов: автоматизируем работу нейросетей c BotHub

продолжить чтение

Вышла новая компактная модель — LFM2-VL-3B

Исследователи представили LFM2-VL-3B — новую мультимодальную модель, которая показывает результаты уровня средних гигантов при объёме всего 3 миллиарда параметров.

продолжить чтение

Почему нас уже тошнит от ИИ-текстов?

О бездушных текстах, и тенденции возврата к авторскому стилю.Картинка со звуком, который может реп не исполнять.У вас есть ощущение, что весь интернет пишет один и тот же человек?

продолжить чтение

Rambler's Top100