OpenAI выпустили GPT-5.5: пишет код дешевле предшественника
GPT-5.5 — это следующая модель после GPT-5.4, ориентированная прежде всего на агентную работу: многошаговые задачи, где модель планирует, использует инструменты и доводит работу до конца без постоянного участия пользователя.На Terminal-Bench 2.0 (сложные командно-строковые сценарии с планированием и итерациями) модель показала 82.7% против 75.1% у GPT-5.4. На SWE-Bench Pro, который оценивает решение реальных GitHub-задач, — 58.6%. Примечательно, что этих результатов GPT-5.5 достигает при меньшем количестве токенов, чем предшественник.
Мир не успевает за ИИ лабораториями
В конце прошлого года появилась новая тема для психоза вокруг нейосетей. На этот раз ей стали кодинг агенты.Люди говрят, что это новая эра в программировании и бла бла бла.Твит от Андрея Карпати в конце зимы:Трудно передать, насколько сильно программирование изменилось из-за ИИ за последние 2 месяца: не постепенно, не в режиме “обычный прогресс”, а резко и с этого декабря. С оговорками, но по большому счёту кодинг-агенты до декабря не работали, а после в целом работают.
Онлайн-вебинар: научи своего AI-агента писать код на Spring
Уже в этот четверг Илья Кучмин (AI DevTools Lead) и Павел Кислов (Эксперт Spring АйО) проведут прямую трансляцию, на которой расскажут, как:ускорить разработку с AI-агентами (Claude, Codex, OpenCode, ...)снизить количество токенов во время решения рабочих задачи получать код, который не приходится переписывать вручную (ну почти)
Opus 4.7, Codex управляет ПК, TTS от Google, бренд кроссовок «переобулся» в ИИ-компанию
Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.Меня зовут
OpenAI: Codex автоматизировал всю дата-платформу – 600 ПБ, 70 000 датасетов и 3500 юзеров
OpenAI официально подтвердила
Разговоры ничего не стоят. Код тоже
В наше время известное изречение Линуса Торвальдса "Talk is cheap. Show me the code." можно переиначить в виде "Code is cheap. Show me the spec." Меня зовут Алекс Гусев и в этой публикации я постараюсь показать, почему я так считаю. У меня есть несколько статей на Хабре, объединённых общей темой: ADSM
«Большой взрыв ИИ»: из-за искусственного интеллекта компании перегружены кодом
Компании спешно пытаются справиться с избытком кодаКогда недавно одна из компаний, предоставляющих финансовые услуги, начала использовать Cursor — технологию искусственного интеллекта, которая пишет компьютерный код, — разница стала заметна сразу же.Компания перешла от 25 000 строк кода в месяц к 250 000 строк. Это привело к накоплению миллиона строк кода, которые необходимо было проверить, рассказала Джони Клипперт, соучредитель и генеральный директор StackHawk, стартапа в сфере кибербезопасности, который сотрудничал с этой финансовой компанией.
Как я превратил Codex в персонального Джарвиса
Эта статья написана от моего лица и отредактирована вместе с Джарвисом.За последние годы я перепробовал много AI-инструментов для разработки: от более “чатовых” сценариев до агентных сред вроде Cursor и Claude. В итоге остановился на Codex. Не потому, что он магический, а потому что это, на мой взгляд, самая сильная система в тот момент, когда ты понимаешь, что именно она делает, где заканчиваются ее возможности и какими рамками ее нужно ограничивать.
Как кодинг-агенты используют инструменты, память и контекст репозитория, чтобы писать код лучше
Это перевод хорошей статьи про базу того, как устроены кодинг-ассистенты и что для них важно: что такое харнесс и харнесс-инжиниринг, в чем разница просто агентной обвязки и кодинговой, что такое компактизация и почему та же самая модель в консольке ощущается мощнее, чем просто в веб-чате. Сильного хардкора и больших откровений в ней нет, но это отличный материал для старта изучения архитектуры кодинг-ассистентов и лучшего понимания, как оно работает внутри.В этой статье я хочу разобрать общую архитектуру кодинг-агентов и агентных харнессов
Agent Harness: одна LLM, разные результаты — в чем секрет?
Использование кодовых агентов (Codex, Cursor, Claude Code) стало обыденностью. Внутри разных AI-агентов могут использоваться одни и те же модели, но результаты будут сильно отличаться. Например, есть мнение, что Cursor лучше и быстрее справится с написанием качественного UI, Claude Code покажет себя лучше в проектировании архитектуры приложения, а WindSurf лучше остальных создаст прототип системы. Почему одна и та же модель в разных агентах дает разный результат? Давайте разбираться.

