5 ошибок при разработке продукта с LLM под капотом – разбор реальных болей живого проекта
Привет, Хабр!Примерно год назад наша команда загорелась идеей создать продукт, который позволил бы «поговорить с кодом». Мы, как и многие, находились под впечатлением от возможностей LLM. Казалось, что ещё немного – и нейросеть возьмёт на себя всю рутину по анализу легаси, аудиту систем и онбордингу новых разработчиков.
Большой законопроект об ИИ в России: первые границы для нейросети?
Звонить в банк, интернет-провайдеру или в службу доставки бывает утомительно: бесконечно вежливый ИИ-ассистент, не понимая контекста, без усталости гоняет ответы по скриптам. В отличие от него пользователь вполне по-настоящему испытывает и злость, и усталость, ожидая соединения с человеком — тем самым, который поймёт вопрос за пять минут.
Я задал очень простой вопрос, но 76% ИИ-моделей мне соврали
Один простой вопрос. Девять уверенных ответов. Восемь из них — ложьДва слова. Пустой системный промпт. Ноль контекста.Я отправил 29 крупнейшим языковым моделям одно сообщение: current date
Мы протестировали 22 нейросети на задачах для российских учителей. Ни одна не знает чувашский
Я живу в Чебоксарах и запускаю ИИ-пилот в местной школе. Когда понадобилось проверить, какие LLM действительно способны помочь российским учителям в их работе — оказалось, что бенчмарка для этого не существует. MERA тестирует, может ли модель решить задания ЕГЭ. EduBench — только английский и китайский. Российское образование — это ФГОС, технологические карты уроков, ОГЭ, чувашский язык — и ничего из этого ни один бенчмарк не покрывает.Мы сделали EduBench-RU — первый бенчмарк для оценки LLM на задачах российского образования в школах. 50 промптов, 22 модели, двойная оценка. И нашли кое-что неожиданное.Что внутри
OpenAI закрывает нейросеть Sora для генерации видео
OpenAI сообщила в социальной сети X о том, что закрывает нейросеть Sora. В ближайшее время компания более детально расскажет о том, когда прекратит работу официальное приложение и API.
Atlassian уволила 1 600 человек и сказала, что «дела идут хорошо». Кто выигрывает от замены людей на ИИ?
Думаю, можно уже сказать прямо: массовые увольнения в tech-секторе — это ужасная идея.Согласны? Да, знаю. Согласиться легко.
Топ-13 бесплатных нейросетей для генерации презентаций в 2026 году
Март не так часто балует нас громкими новинками, как хотелось бы, но индустрия не стоит на месте. В прошлой статье я рассказывал о ИИ-инструментах/агентах/сервисах для программистов, и в процессе размышлений у меня родилась идея для нового материала.В своих сравнительных статьях о топовых LLM я обычно делаю упор на рутинные задачи: генерацию текста, программирование и математику. Но спектр таких задач гораздо шире. Именно эта мысль привела меня к теме сегодняшней статьи.
Open-source персистентная память для LLM
Последние полгода я занимаюсь задачей, которая поначалу казалась тривиальной: научить LLM помнить, с кем она разговаривает.Задача звучит просто. На практике — нет.Если вы строили чат-бот или AI-агента, вы знаете ощущение: пользователь написал, что он вегетарианец, а через три сообщения модель предлагает ему стейк-хаус. Или пациент сообщил об аллергии на пенициллин, а ассистент через час забыл и порекомендовал амоксициллин. В рамках одного контекстного окна всё работает. Но стоит начать новую сессию — чистый лист, модель не помнит ничего.Написал NGT Memory
В России представили первую открытую методологию тестирования RAG‑систем
Исследователи из Сбера (команда SberAI), МТС Web Services (MWS AI) и ведущих российских и международных вузов разработали первую открытую динамическую методологию тестирования русскоязычных систем генеративного ИИ с поиском (RAG). Работу приняли на EACL 2026 — одну из крупнейших конференций по компьютерной лингвистике, которая проходит с 24 по 29 марта 2026 года в Рабате (Марокко), рассказали Хабру в МТС.

