codex.

OpenAI выпустили GPT-5.5: пишет код дешевле предшественника

GPT-5.5 — это следующая модель после GPT-5.4, ориентированная прежде всего на агентную работу: многошаговые задачи, где модель планирует, использует инструменты и доводит работу до конца без постоянного участия пользователя.На Terminal-Bench 2.0 (сложные командно-строковые сценарии с планированием и итерациями) модель показала 82.7% против 75.1% у GPT-5.4. На SWE-Bench Pro, который оценивает решение реальных GitHub-задач, — 58.6%. Примечательно, что этих результатов GPT-5.5 достигает при меньшем количестве токенов, чем предшественник.

продолжить чтение

Оставлено в

Мир не успевает за ИИ лабораториями

В конце прошлого года появилась новая тема для психоза вокруг нейосетей. На этот раз ей стали кодинг агенты.Люди говрят, что это новая эра в программировании и бла бла бла.Твит от Андрея Карпати в конце зимы:Трудно передать, насколько сильно программирование изменилось из-за ИИ за последние 2 месяца: не постепенно, не в режиме “обычный прогресс”, а резко и с этого декабря. С оговорками, но по большому счёту кодинг-агенты до декабря не работали, а после в целом работают.

продолжить чтение

Оставлено в

Онлайн-вебинар: научи своего AI-агента писать код на Spring

Уже в этот четверг Илья Кучмин (AI DevTools Lead) и Павел Кислов (Эксперт Spring АйО) проведут прямую трансляцию, на которой расскажут, как:ускорить разработку с AI-агентами (Claude, Codex, OpenCode, ...)снизить количество токенов во время решения рабочих задачи получать код, который не приходится переписывать вручную (ну почти)

продолжить чтение

Оставлено в

Opus 4.7, Codex управляет ПК, TTS от Google, бренд кроссовок «переобулся» в ИИ-компанию

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.Меня зовут

продолжить чтение

Оставлено в

OpenAI: Codex автоматизировал всю дата-платформу – 600 ПБ, 70 000 датасетов и 3500 юзеров

OpenAI официально подтвердила

продолжить чтение

Оставлено в

Разговоры ничего не стоят. Код тоже

В наше время известное изречение Линуса Торвальдса "Talk is cheap. Show me the code." можно переиначить в виде "Code is cheap. Show me the spec." Меня зовут Алекс Гусев и в этой публикации я постараюсь показать, почему я так считаю. У меня есть несколько статей на Хабре, объединённых общей темой: ADSM

продолжить чтение

Оставлено в

«Большой взрыв ИИ»: из-за искусственного интеллекта компании перегружены кодом

Компании спешно пытаются справиться с избытком кодаКогда недавно одна из компаний, предоставляющих финансовые услуги, начала использовать Cursor — технологию искусственного интеллекта, которая пишет компьютерный код, — разница стала заметна сразу же.Компания перешла от 25 000 строк кода в месяц к 250 000 строк. Это привело к накоплению миллиона строк кода, которые необходимо было проверить, рассказала Джони Клипперт, соучредитель и генеральный директор StackHawk, стартапа в сфере кибербезопасности, который сотрудничал с этой финансовой компанией.

продолжить чтение

Оставлено в

Как я превратил Codex в персонального Джарвиса

Эта статья написана от моего лица и отредактирована вместе с Джарвисом.За последние годы я перепробовал много AI-инструментов для разработки: от более “чатовых” сценариев до агентных сред вроде Cursor и Claude. В итоге остановился на Codex. Не потому, что он магический, а потому что это, на мой взгляд, самая сильная система в тот момент, когда ты понимаешь, что именно она делает, где заканчиваются ее возможности и какими рамками ее нужно ограничивать.

продолжить чтение

Оставлено в

Как кодинг-агенты используют инструменты, память и контекст репозитория, чтобы писать код лучше

Это перевод хорошей статьи про базу того, как устроены кодинг-ассистенты и что для них важно: что такое харнесс и харнесс-инжиниринг, в чем разница просто агентной обвязки и кодинговой, что такое компактизация и почему та же самая модель в консольке ощущается мощнее, чем просто в веб-чате. Сильного хардкора и больших откровений в ней нет, но это отличный материал для старта изучения архитектуры кодинг-ассистентов и лучшего понимания, как оно работает внутри.В этой статье я хочу разобрать общую архитектуру кодинг-агентов и агентных харнессов

продолжить чтение

Оставлено в

Agent Harness: одна LLM, разные результаты — в чем секрет?

Использование кодовых агентов (Codex, Cursor, Claude Code) стало обыденностью. Внутри разных AI-агентов могут использоваться одни и те же модели, но результаты будут сильно отличаться. Например, есть мнение, что Cursor лучше и быстрее справится с написанием качественного UI, Claude Code покажет себя лучше в проектировании архитектуры приложения, а WindSurf лучше остальных создаст прототип системы. Почему одна и та же модель в разных агентах дает разный результат? Давайте разбираться.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

codex.

OpenAI выпустили GPT-5.5: пишет код дешевле предшественника

Мир не успевает за ИИ лабораториями

Онлайн-вебинар: научи своего AI-агента писать код на Spring

Opus 4.7, Codex управляет ПК, TTS от Google, бренд кроссовок «переобулся» в ИИ-компанию

OpenAI: Codex автоматизировал всю дата-платформу – 600 ПБ, 70 000 датасетов и 3500 юзеров

Разговоры ничего не стоят. Код тоже

«Большой взрыв ИИ»: из-за искусственного интеллекта компании перегружены кодом

Как я превратил Codex в персонального Джарвиса

Как кодинг-агенты используют инструменты, память и контекст репозитория, чтобы писать код лучше

Agent Harness: одна LLM, разные результаты — в чем секрет?

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

codex.