Вышла GPT-5.6 Sol: уровень Mythos (Fable), но дешевле по токенам
Новое семейство GPT-5.6 разбили на три тира: Sol (флагман), Terra (на уровне GPT-5.5, но вдвое дешевле) и Luna (быстрый и самый дешёвый). Цифра теперь обозначает поколение, а Sol/Terra/Luna задают уровень по интеллекту, скорости и цене.
Разработчики больше не нужны? Новое исследование Anthropic на 400 000 сессий — и мой спор с ним
Anthropic выложила исследование на ~400 000 сессий Claude Code: успех с AI-агентами определяет не умение писать код, а понимание своего дела. Профессия почти не важна — у не-программистов 26% подтверждённого успеха против 30% у разработчиков.Эксперт в предметной области запускает в 2.4× больше действий агента на одну команду (12 против 5) и вчетверо чаще вытаскивает зашедшую в тупик сессию (15% против 4% у новичка).Половину этого я писал раньше: планируй, говори агенту «что», а не «как», и разбирайся в том, что делаешь. Приятно, когда данные сходятся с интуицией.
Loop Engineering: 14 шагов от промптера до архитектора систем
Два года работа c AI-агентами для написания кода выглядели одинаково: написать промпт, передать контекст, прочитать дифф, написать следующий промпт. Агент был инструментом, человек держал его за руку от начала до конца. Эта схема устаревает.Loop Engineering: сборка небольшой системы, которая сама находит задачу, передаёт её агенту, проверяет результат, фиксирует, что произошло, и решает, что делать дальше. Систему проектируют один раз, дальше она сама промптит агента.Материал собран из инженерной документации Anthropic, эссе Эдди Османи (Addy Osmani) о loop engineering и недавних замеров продуктивности. Три уровня:
Большая сила маленьких PR-ов в эру AI
Всем привет, меня зовут Михаил Поливаха, я являюсь техническим лидером проекта Axelix.В Axelix со временем добавляется всё больше и больше сторонних контрибьютеров, которых мы очень приветствуем. И всё больше и больше я сталкиваюсь с некоторым непониманием некоторых строгих гайдлайнов, которые установлены на проекте. Именно сегодня, речь пойдёт про размер PR-а.У нас есть собственный GitHub Action, который блокирует PR в том случае, если суммарное количество измененных строк кода превышает 500.
Средовой подход вместо системного: как проектировать ИТ-продукты, которые растят сами себя
Привет, Хабр! В своей прошлой статье про будущее ИТ я писал о важности формулирования новых вызовов в индустрии:
Как мы отучали LLM выдумывать цифры в данных. Допрос Claude Desktop с пристрастием
Никто не верил, что модель можно подпустить к таблицам и заставить не галлюцинировать. Цифры из воздуха, выдуманные колонки, суммы, которые не сходятся с источником, думаю на этом обжигались все, кто пробовал. Мы заставили, проблемы все еще есть, но выглядят решаемыми.
Skill of the week: Spring Data JDBC — качество Opus на модели за копейки
Ранее в рубрике Skill of the Week мы уже разбирали Skill для Spring Data JPA
Project Valhalla: 10 спустя
В Java наконец появляется ответ на старую проблему: полноценные классы часто слишком дорогие для памяти и процессора.Пример - массив из миллиона, например, точек Point. Сейчас это обычно не миллион точек подряд, а миллион ссылок на объекты в куче. У каждого объекта есть служебные данные, его нужно создать, потом убрать сборщиком мусора. Плюс процессор постоянно прыгает по памяти, а это медленно.Project Valhalla добавляет value class
Skills исправляют привычки MCP исправляет память
Я долго пытался решить одну проблему Claude Code в разных сессиях ведет себя поразному и это иногда просто ломает логику работысначала думал что дело в промптах потом начал думать что проблема в контексте но в итоге стало понятно что все немного глубже.

