Программирование.

Вышла GPT-5.6 Sol: уровень Mythos (Fable), но дешевле по токенам

Новое семейство GPT-5.6 разбили на три тира: Sol (флагман), Terra (на уровне GPT-5.5, но вдвое дешевле) и Luna (быстрый и самый дешёвый). Цифра теперь обозначает поколение, а Sol/Terra/Luna задают уровень по интеллекту, скорости и цене.

продолжить чтение

Разработчики больше не нужны? Новое исследование Anthropic на 400 000 сессий — и мой спор с ним

Anthropic выложила исследование на ~400 000 сессий Claude Code: успех с AI-агентами определяет не умение писать код, а понимание своего дела. Профессия почти не важна — у не-программистов 26% подтверждённого успеха против 30% у разработчиков.Эксперт в предметной области запускает в 2.4× больше действий агента на одну команду (12 против 5) и вчетверо чаще вытаскивает зашедшую в тупик сессию (15% против 4% у новичка).Половину этого я писал раньше: планируй, говори агенту «что», а не «как», и разбирайся в том, что делаешь. Приятно, когда данные сходятся с интуицией.

продолжить чтение

Loop Engineering: 14 шагов от промптера до архитектора систем

Два года работа c AI-агентами для написания кода выглядели одинаково: написать промпт, передать контекст, прочитать дифф, написать следующий промпт. Агент был инструментом, человек держал его за руку от начала до конца. Эта схема устаревает.Loop Engineering: сборка небольшой системы, которая сама находит задачу, передаёт её агенту, проверяет результат, фиксирует, что произошло, и решает, что делать дальше. Систему проектируют один раз, дальше она сама промптит агента.Материал собран из инженерной документации Anthropic, эссе Эдди Османи (Addy Osmani) о loop engineering и недавних замеров продуктивности. Три уровня:

продолжить чтение

Большая сила маленьких PR-ов в эру AI

Всем привет, меня зовут Михаил Поливаха, я являюсь техническим лидером проекта Axelix.В Axelix со временем добавляется всё больше и больше сторонних контрибьютеров, которых мы очень приветствуем. И всё больше и больше я сталкиваюсь с некоторым непониманием некоторых строгих гайдлайнов, которые установлены на проекте. Именно сегодня, речь пойдёт про размер PR-а.У нас есть собственный GitHub Action, который блокирует PR в том случае, если суммарное количество измененных строк кода превышает 500.

продолжить чтение

Как правильно выбрать эмбеддинг для проекта

Эмбеддинги (иначе говоря, векторные представления) — это способ представления абстрактных данных в виде набора чисел (в виде векторов, как вы могли уже понять), близкие значения которых связаны семантически и математически и с которыми может работать модель искусственного интеллекта. Разберемся какие модели лучше других подходят для кодирования слов. Параллельно с этим разберём принципы, на которые нужно опираться при выборе эмбеддинг-модели, пощупаем русские BERT-модели и внесём ясность про системные требования, контекстное окно и размер батча.1. Типы эмбеддингов и области применения

продолжить чтение

Средовой подход вместо системного: как проектировать ИТ-продукты, которые растят сами себя

Привет, Хабр! В своей прошлой статье про будущее ИТ я писал о важности формулирования новых вызовов в индустрии:

продолжить чтение

Как мы отучали LLM выдумывать цифры в данных. Допрос Claude Desktop с пристрастием

Никто не верил, что модель можно подпустить к таблицам и заставить не галлюцинировать. Цифры из воздуха, выдуманные колонки, суммы, которые не сходятся с источником, думаю на этом обжигались все, кто пробовал. Мы заставили, проблемы все еще есть, но выглядят решаемыми.

продолжить чтение

Skill of the week: Spring Data JDBC — качество Opus на модели за копейки

Ранее в рубрике Skill of the Week мы уже разбирали Skill для Spring Data JPA

продолжить чтение

Project Valhalla: 10 спустя

В Java наконец появляется ответ на старую проблему: полноценные классы часто слишком дорогие для памяти и процессора.Пример - массив из миллиона, например, точек Point. Сейчас это обычно не миллион точек подряд, а миллион ссылок на объекты в куче. У каждого объекта есть служебные данные, его нужно создать, потом убрать сборщиком мусора. Плюс процессор постоянно прыгает по памяти, а это медленно.Project Valhalla добавляет value class

продолжить чтение

Skills исправляют привычки MCP исправляет память

Я долго пытался решить одну проблему Claude Code в разных сессиях ведет себя поразному и это иногда просто ломает логику работысначала думал что дело в промптах потом начал думать что проблема в контексте но в итоге стало понятно что все немного глубже.

продолжить чтение