dora.

Что происходит с SDLC в эпоху AI-агентов

Несколько месяцев назад в публичном пространстве появилась история, которую в engineering-сообществе стали называть поучительной. Команда AWS использовала внутренний AI-инструмент Kira для ускорения работы. Kira предложила джуниорам сценарий: переразверни продакшн-слой. Инженеры согласились. Следующие шесть часов весь AWS не работал. После разбора полётов компания объявила новое правило: финальный апрув на изменения, предложенные агентом, должен давать сениор-инженер.

продолжить чтение

Оставлено в

Метрики ИИ-трансформации: как отличить реальную пользу от хайпа

продолжить чтение

Оставлено в

Реальный DX: как измерить опыт разработчика и не соврать самому себе

В прошлый раз я писал

продолжить чтение

Оставлено в

Три попытки обогнать в бенче базовую Gemma 4 дообучением — и все три мимо

У нас есть открытый бенчмарк https://github.com/csylabs-org/lii-sport-bench-ru для оценки русскоязычных LLM на спортивном домене — ЛИИ-Спорт-Bench-RU, 655 экспертных вопросов по 35 видам спорта. В прошлой статье мы выбрали базовую модель: Gemma 4 31B. После этого начался главный вопрос — как сделать её лучше под домен.Две недели мы пытались обогнать собственную базу. Файнтюном. Потом ещё раз файнтюном на переделанном корпусе. Потом — RAG. Все три раунда базовая версия выиграла.

продолжить чтение

Оставлено в

Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B

TL;DR — leaderboard за один взглядЗа последние 2 недели собрал открытый бенчмарк из 655 экспертных вопросов по 35 видам спорта на русском. Запустил семь моделей через ансамбль из трёх судей: Claude Opus 4.7, Gemini 3.1 Pro, GPT-5.5, DeepSeek V4 Flash, Qwen 3.5 27B, Gemma 4 31B, Qwen 3.6 27B.Frontier-closed (Opus / Gemini / GPT-5.5) — топ-3 по сырым цифрам. Открытый топ (DeepSeek V4 Flash) — четвёртая позиция, +0.58 от Gemma. И всё равно базой ЛИИ остаётся Gemma 4 31B. Защита позиции — три аргумента + разбор где конкретно живёт разрыв и почему он SFT-recoverable.РангМодельВесаnТочностьПолнота

продолжить чтение

Оставлено в

ИТ вам не завод: почему на разработку продукта всегда нужно «слишком много» времени

Разберем, почему попытки оцифровать интеллект через нормо-часы и коммиты ведут к деградации продукта, и как на самом деле устроена невидимая зона создания ИТ-решений, где ценность рождается из исследования и анализа, а не из скорости стука по клавишам.

продолжить чтение

Оставлено в

Обзор выпусков подкаста о проблемах DevOps

Привет, Хабр! Будущее уже наступило или все, что сейчас происходит в IT — только репетиция перед настоящими изменениями? У каждого на этот счёт своё мнение, но практики DevOps, которые решают реальные задачи на стыке разработки, эксплуатации и бизнеса сталкиваются с этим вопросом ежедневно.

продолжить чтение

Оставлено в

Что скрывается за аббревиатурой DORA и как она повлияет на ИТ-инфраструктуру

Информационный ландшафт современного мира стремительно меняется, что порождает новые вызовы и риски для организаций любого масштаба. В частности, в финансовом секторе зависимость от современных технологий достигла беспрецедентного уровня, делая жизненно важным поддержание операционной устойчивости информационных систем и коммуникаций.

продолжить чтение

Оставлено в

Куда нас вынесут большие технологические волны DevOps

В 1995 году с легкой руки Gartner в умах многих аналитиков по всему миру поселился новый термин — Gartner Hype Cycle. Как только не называли эту кривую: и цикл хайпа, и цикл зрелости, и цикл ожиданий. Но мне больше всего нравится представлять её в виде волн. Тогда в ней появляется глубокий образ — множество волн, которые в нашем технологическом мире переплетаются и рождают нашу повседневность.Привет, Хабр! Меня зовут Антон Черноусов. Я Developer Advocate в Yandex Cloud и многие годы веду подкаст «The Art Of Programming».

продолжить чтение

Оставлено в

Отчет DORA–2024: как ведущие команды достигают успеха в разработке ПО

При создании этого материала были использованы данные отчета DORA Accelerate State of DevOps 2024В конце октября 2024 DORA выпустила очередной отчет Accelerate State of DevOps — результаты масштабного ежегодного исследования об эффективности разработки. В этой статье команда KT.Team суммировала выводы исследователей DORA о том, как работают эффективные команды разработки. Здесь же вы найдете ключевые советы DORA: какие подходы внедрить, чтобы повысить результативность команды и оправдать ожидания бизнеса.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

dora.

Что происходит с SDLC в эпоху AI-агентов

Метрики ИИ-трансформации: как отличить реальную пользу от хайпа

Реальный DX: как измерить опыт разработчика и не соврать самому себе

Три попытки обогнать в бенче базовую Gemma 4 дообучением — и все три мимо

Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B

ИТ вам не завод: почему на разработку продукта всегда нужно «слишком много» времени

Обзор выпусков подкаста о проблемах DevOps

Что скрывается за аббревиатурой DORA и как она повлияет на ИТ-инфраструктуру

Куда нас вынесут большие технологические волны DevOps

Отчет DORA–2024: как ведущие команды достигают успеха в разработке ПО

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

dora.