Я заставил 14 нейросетей врать: Большой аудит галлюцинаций 2026
Или как я потратил неделю, чтобы доказать: ИИ сегодня — это красноречивые лжецы в костюмах экспертов.В конце 2025 года я устал читать маркетинг в стиле «наша модель умнее ChatGPT на 15%». Умнее по какому бенчмарку? MMLU? Это всё равно что мерить интеллект человека по результатам ЕГЭ.Я решил проверить одну простую вещь: способна ли нейросеть сказать «я не знаю»?Потому что в реальном мире — в медицине, праве, финансах — ответ «я не уверен» стоит дороже любой красивой, но выдуманной истории.Ниже — результаты слепого тестирования 14 топовых LLM (включая Claude 4.5, GPT-5.2, Gemini 3, Qwen, YandexGPT и
AI-Accelerated Engineers VS AI Governance Engineers (новые типы специалистов в 2026 году)
Раньше в резюме строчка Уверенный пользователь MS Office (Word, Excel) была обязательна, так же как стрессоустойчивость, коммуникабельность, работа в команде.Думаю, теперь обязательной строкой станет:«Уверенный пользователь AI. Problem decomposition, structured prompting, critical evaluation of AI outputs, code and workflow automation.»Я уже вижу, насколько отличается скорость разработки у инженеров, которые активно используют ИИ и у тех кто не используют ИИ вообще или используют его неэффективноИ в будущем это еще сильнее будет бросаться в глазаПри этом, по моему ощущению, командам нужны два типа инженеров.
AI без интернета (офлайн) на своем компьютере
Зачем это обывателю?Кейсов на самом деле не мало, как минимум это бесплатно и дает возможность запускать AI без облака, чтобы ничего не отправлялось в интернет (приватность, скорость), ну и на случай если упадет интернет как например у нас было в Испании когда все электричество пропало, хорошо бы иметь умного ИИ с которым можно будет пообщаться)Еще можно использовать как офлайн переводчик или объяснялку без интернета, помощника по учебе и изучения чего либо.Для профессионалов это вообще оогромная область, от исследования как это работает до разного рода кастомизаций и применений.
Как найти работу джуну, когда джуны никому не нужны
Если кажется, что вы видите только вакансии для сеньоров и лидов, то вам не кажется. Компании оптимизируют всё, что движется. И джуны в в эту картину вписываются со скрипом.А всё потому, что джун — это инвестиция. И в него придётся вкладывать ресурсы: время лидов на менторинг и проверку работы, время на адаптацию и онбординг, деньги на зарплату, в конце концов. В условиях текущей экономики бизнес хочет быстрых результатов.
Instacart прекратит эксперимент с ценообразованием на основе ИИ
Американская онлайн-платформа доставки продуктов и товаров Instacart прекратит тестирование ценообразования с использованием искусственного интеллекта. Проект свернули в связи с тем, что некоторые пользователи видели более высокие цены на определённые позиции.
Эксперты прокомментировали акселератор «Умный город» в МГТУ им. Н.Э. Баумана
15 декабря в МГТУ им. Н.Э. Баумана (в питчинг-формате) прошел финальный Демо-день акселерационных программ «Умный город» и «Робототехника и беспилотные авиационные системы» (БАС). В течение трех месяцев студенческие команды под руководством опытных наставников последовательно работали над своими проектами. На мероприятии в МГТУ они представляли свои разработки бизнес-сообществу, инвестиционным фондам, институтам развития и другим заинтересованным сторонам, которые способствуют укреплению технологического суверенитета.
Как UX-решения помогают e-commerce снижать число возвратов товара: опыт мировых лидеров
Возвраты товаров остаются одной из ключевых проблем онлайн-ритейла. По данным международных исследований, около четырёх из пяти возвратов связаны не с качеством товара, а с неточностями на этапе выбора. Это означает, что снижение возвратов начинается задолго до оформления заказа – на уровне UX-решений, определяющих, насколько корректно пользователь понимает товар.В исследовании мы изучили 25 мобильных приложений крупнейших e-commerce-компаний из России и зарубежных рынков. В четырёх товарных категориях с наиболее частыми ошибками выбора были выделены 14 инструментов, которые помогают снизить риск возвратов.
LLM-клиент с MCP – дорогой и неэффективный подход в разработке
В наше время тяжело представить разработку цифровых продуктов, в которые хоть в какой-то степени не включили так называемый ИИ на больших языковых моделях (LLM). И я вовсе не против, но у меня вызывают вопросы подходы разработчиков к способам внедрения интеллектуальных инструментов в свои продукты.Думаю, абсолютное большинство оптимальным способом внедрения интеллекта в продукт выбрали использование проприетарных моделей через API, с добавлением кастомного функционала через вызовы MCP серверов. Кажется, это уже даже стало стандартом, и в этом я вижу проблему.
Cursor и ИИ-ассистенты ускоряют разработку — но без нормальных автотестов топят всю команду
Привет, Хабр. Пишу, потому что на текущем проекте прямо сейчас живу эту боль: всем включили Cursor «для скорости», а нормальных автотестов так и не завезли. Может, кто-то уже описывал этот кейс, но я не нашёл — поэтому делюсь своей ситуацией и тем, как это надо было делать с самого начала.Как это обычно происходитРуководство/CTO/кто-то сверху читает твиты про то, как «скорость разработки ×10 за счёт ИИ», проводит собрание и выдаёт директиву: «Теперь весь код пишем через Cursor или другие ИИ-ассистенты».
Fix Price получил диплом конкурса Retail TECH проектов 2025
Проект «Внедрение GenAl в процесс контроля стандартов» получил Диплом ЛауреатаFix Price отмечен дипломом конкурса Retail TECH проектов 2025 в номинации «Лидер в Al (в ритейле)» за проект «Внедрение GenAl в процесс контроля стандартов».На суд жюри компания представила свою систему видеоаналитики на основе генеративного искусственного интеллекта, которая функционирует в магазинах Fix Price и осуществляет контроль выкладки товаров и состояния торгового зала. ИИ анализирует фотографии торгового зала, затем формирует замечания и отправляет задачи на устранение нарушений в мобильное приложение заведующего магазином.

