модель.

Как мы научили нейросеть экономить газ в нашем сталепрокатном цехе

На станах горячего проката металлургического комбината ЕВРАЗ НТМК прокатывают заготовки разных марок стали. В начале цикла их разогревают в печах до температуры, позволяющей придать нужный профиль. Печей несколько, они различаются конструкцией, состоянием, горелками и износом футеровки — это теплоизолирующий материал. Путь заготовки до первой клети стана тоже разный. Ещё на процесс влияют особенности серий заготовок, сортамента сталей, температуры перед посадом, текущее состояние агрегатов, время перевалки, плановые и внеплановые остановы.

продолжить чтение

Оставлено в

DeepSeek V4: Обзор нейросети, бенчмарки и тесты

Нейросети не стоят на месте и постоянно развиваются. Так, 23 апреля мир увидел ChatGPT 5.5. Но лично я с большим нетерпением ждал именно DeepSeek V4. Сколько времени прошло с того момента, как появились первые слухи о будущем релизе от китайской компании? Предыдущая версия запомнилась мне хорошим показателем в повседневных задачах и, что немаловажно, полной бесплатностью.

продолжить чтение

Оставлено в

Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение

VLA, или Vision-Language-Action models, сегодня становятся одной из основных парадигм в робототехнике. Идея выглядит естественно: если большие визуально-языковые модели уже умеют связывать изображение, текст и высокоуровневое понимание сцены, то следующий шаг состоит в том, чтобы добавить к этому действия робота. Так появляется единый контур, в котором модель видит сцену, понимает инструкцию на естественном языке и выдаёт осмысленное управление.

продолжить чтение

Оставлено в

Реставрация ruGPT-3 XL или как я вернул к жизни забытую русскую языковую модель

Несколько дней к ряду я занимался реставрацией легаси модели ai-forever/rugpt3xl, это классическая языковая модель от SberDevices на 1.3B параметров, крошка по современным меркам, на которой сберовцы обкатывали свои научные наработки аж в далёком 2021м году. Подробнее о ней можно почитать в статье “A family of pretrained transformer language models for Russian” на Google Scholar.

продолжить чтение

Оставлено в

Система мониторинга ML-моделей: превращаем данные в полезный инструмент

В прошлой статье мы разобрали, из каких компонентов собирается система мониторинга, и составили инструкции, чтобы указывать на действительно важные проблемы. Пришло время выстроить их в единую систему. Она должна масштабироваться и давать ясную картину происходящего, чтобы наш мониторинг не был бесполезным потребителем ресурсов.В этой статье мы сформулируем правила, которые помогут:организовать хранение данных для масштабируемости;построить понятную визуализацию на дэше;настроить осмысленные оповещения;написать документацию.

продолжить чтение

Оставлено в

Система мониторинга ML-моделей: что важно контролировать и почему

«Обучил, запустил и забыл» — плохая стратегия работы с ML‑моделями, но она часто встречается после удачного тестирования. Качество моделей может незаметно снижаться, и если пропустить этот момент — последствия могут дорого стоить. Когда мы начали задумываться о системе мониторинга, одна из наших моделей начала выдавать предсказания, которые требовали незамедлительного вмешательства в выстроенную работу. Но разум подсказывал, что проблема не в процессе, а в модели. О том, каким трудоемким оказалось наше расследование, и как мы восстанавливали и изучали каждую составляющую процесса почти вслепую, читайте по

продолжить чтение

Оставлено в

Alibaba представила подробный технический отчет Qwen3-VL

продолжить чтение

Оставлено в

Как мы вырастили ML-фреймворк внутри компании: эволюция, ошибки и инсайты

Привет, Хабр! Меня зовут Юля Корышева, я разработчик машинного обучения в команде скоринга в билайне. В этой статье расскажу, как за последние пять лет в нашей команде менялся подход к разработке, валидации и поддержке моделей — с какими вызовами мы столкнулись, как их решали и к каким результатам пришли.

продолжить чтение

Оставлено в

Книга: «Строим LLM с нуля»

Привет, Хаброжители!

продолжить чтение

Оставлено в

Не пишу постмиты после встреч и звонков, за меня это делает AI

Привет, Хабр! Я Роман Путилов, руковожу техническими менеджерами в Cloud.ru. Встреч у меня много, а времени на постмиты мало. Поэтому я отдал рутину искусственному интеллекту: он собирает черновик, а я за 3–5 минут довожу его до финала.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

модель.

Как мы научили нейросеть экономить газ в нашем сталепрокатном цехе

DeepSeek V4: Обзор нейросети, бенчмарки и тесты

Green-VLA: как мы собрали VLA-модель для реального антропоморфного робота и не потеряли обобщение

Реставрация ruGPT-3 XL или как я вернул к жизни забытую русскую языковую модель

Система мониторинга ML-моделей: превращаем данные в полезный инструмент

Система мониторинга ML-моделей: что важно контролировать и почему

Alibaba представила подробный технический отчет Qwen3-VL

Как мы вырастили ML-фреймворк внутри компании: эволюция, ошибки и инсайты

Книга: «Строим LLM с нуля»

Не пишу постмиты после встреч и звонков, за меня это делает AI

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

модель.