Фрейд для LLM. Разбор очередной статьи на arXive
Наткнулся на очередное исследование учёных, в котором они выявили психические проблемы у LLM. Такие исследования публикуются регулярно, и регулярно в них проявляется полное непонимание вполне умными людьми, как работает нейросеть.Давайте разбираться.Представьте, психиатр приходит к Иннокентию Смоктуновскому, который готовится к роли Гамлета, и спрашивает: «Что вас беспокоит?». Он отвечает: «Убийство отца и предательство матери». Психиатр выписывает антидепрессанты и предупреждает участкового, очевидно, что у актера депрессия и семейная драма.Примерно такую логическую ошибку совершают авторы новой статьи «
Ускоренный идиот на подхвате: как писать тексты с помощью ИИ, проходя чекеры и экономя время
Недолго музыка играла: бурное ликование, которое наблюдалось с приходом ИИ в массы, плавно перешло в ненависть. Теперь ИИшные тексты едва ли не преданы анафеме, а люди подозрительно ищут нейросеть там, где её никогда не стояло, докапываясь до длинных тире, списков и пропуская через ИИ-детекторы. Как сделать так, чтобы и с помощью LLM не проститься, и чекер не завизжал: «Аларма, это не человек, а GenAI!»?
Как LLM-модель за 5 месяцев сократила обращения в поддержку на 24%
Ежегодно 350 тысяч сотрудников Росатома создают примерно 1 200 000 обращений в поддержку. Значительная часть приходилось на систему для ведения бухгалтерского, налогового, регламентированного учета «1С: ERP 2.0 Цифровой Росатом». После внедрения ИИ-продукта «Атом.Зая» это количество сократилось на 24%. В этом тексте хочу рассказать, как мы двигались, чего удалось добиться, и какие уроки извлекли.Как выглядела работа поддержки раньше
OpenAI выпустили GPT-5.2-Codex
GPT-5.1-Codex-Max в прошлый раз сделал ставку на масштаб: компакция контекста и агентные циклы длиной в сутки. GPT-5.2-Codex развивает ту же идею, но делает её более надёжной и прикладной для реальных продакшн-сценариев.Если 5.1-Codex-Max показывал максимум на SWE-Bench и SWE-Lancer, то 5.2-Codex подтверждает прогресс уже на agent-ориентированных бенчмарках:SWE-Bench Pro: 56.4% (против 55.6% у GPT-5.2)Terminal-Bench 2.0: 64.0%, уверенное лидерство в реальных CLI-задачах
Настраиваем ИИ-помощника бесплатно и без вендорлока в IntelliJ IDEA, GoLand, WebStorm, OpenIDE и GigaIDE
За последние пару лет IDE реально встряхнуло: к подсказкам и рефакторингам добавились AI-ассистенты a.k.a. Агенты. Они дописывают код, предлагают варианты решений, генерируют тесты и умеют “переводить” чужой legacy на человеческий. Теперь почти в каждой IDE есть кнопка «спросить у модели» — и разработчик больше не один на один с редактором.
10% на LLM и 90% на инженерию: как российские компании используют ИИ
Привет, Хабр!Продолжаю делиться материалами живых дискуссий, которые идут на телеграм-канале Dev Q&A. На этот раз тема — выбор между open source и коммерческими LLM для корпоративных задач. Получилось собрать практиков, которые каждый день решают эту дилемму: Андрея Кувалдина («Транссеть»), Сергея Олькова («Диасофт»), Максима Семёнкина (CodeInside), Артема Панькова (Secret Agents), Владислава Кудинова (Veai), Константина Глазкова (СП.АРМ), Лорана Джейкобса (iPavlov AI-Systems) и Виталия Попова («Софтлайн Решения»).
ИИ в разработке: почему иногда «в три раза быстрее» не означает «проект раньше»
Привет, Хабр!Недавно собрались с коллегами в эфире ТГ канала для разработчиков обсудить то, что сейчас волнует, кажется, каждого в индустрии — ИИ-инструменты в разработке. Не абстрактно «что думаете про ChatGPT», а конкретно: что реально работает, что нет, и почему при всём хайпе проекты не стали выходить быстрее.Получилась хорошая дискуссия с Алексеем Цыкаревым (Spectr), Виталием Поповым («Софтлайн Решения»), Ярославом Янгалычевым (ТИМ ФОРС), Романом Смирновым («Девелоника»), Олегом Елмановым (Fusion), Владиславом Кудиновым (VeAI) и мной от «Диасофта».
Учимся правильно использовать ИИ при разработке программного обеспечения
Недавно написал статью о проблемах использования ИИ (Иллюзии Интеллекта) при разработке программного обеспечения / Хабр, и решил не ждать у моря погоды, когда (и если) провайдеры исправят ситуацию на своей стороне, а попытаться самостоятельно выработать приемлемый алгоритм работы с ИИ, который был бы экономически выгодным и целесообразным при разработке ПО хотя бы лично для меня.Данная статья - это очередной Хабрахак
Галлюцинации ИИ — это не баг, а фича разработчика. Почему вайб-кодинг не заменит программистов
Привет, Хабр!Знаете, что общего у ChatGPT, моего студенческого кода в три часа ночи и выступлений некоторых экспертов? Все они периодически галлюцинируют. Разница только в том, что от ИИ мы почему-то ждём идеальной точности, а от людей — нет.Недавно провели стрим, где собрались специалисты, у которых ИИ не в презентациях, а в production: Сергей Спиренков (KODE), Александр Константинов (Cloud.ru), Михаил Ларкин (Сбер, ВТБ, S7), Иван Будник (ИИ-стартапы, e-commerce) и Константин Чуйков (Vibe Coding Community). Провели разговор про галлюцинации моделей и про будущее разработки с ИИ.
Бизнесы и их сайты пока не готовы к тому, что уже происходит с поисковой выдачей: AI SEO (GEO) как новая реальность
Недавно мы провели первую на российском диджитал-рынке GEO-прожарку. Формат не новый, но вот продукт… Новый, непонятный и мало исследованный — поэтому мы взяли на вооружение и углубились в него.

