Машинное обучение. - страница 4

5 ошибок при разработке продукта с LLM под капотом – разбор реальных болей живого проекта

Привет, Хабр!Примерно год назад наша команда загорелась идеей создать продукт, который позволил бы «поговорить с кодом». Мы, как и многие, находились под впечатлением от возможностей LLM. Казалось, что ещё немного – и нейросеть возьмёт на себя всю рутину по анализу легаси, аудиту систем и онбордингу новых разработчиков.

продолжить чтение

Большой законопроект об ИИ в России: первые границы для нейросети?

Звонить в банк, интернет-провайдеру или в службу доставки бывает утомительно: бесконечно вежливый ИИ-ассистент, не понимая контекста, без усталости гоняет ответы по скриптам. В отличие от него пользователь вполне по-настоящему испытывает и злость, и усталость, ожидая соединения с человеком — тем самым, который поймёт вопрос за пять минут.

продолжить чтение

Я задал очень простой вопрос, но 76% ИИ-моделей мне соврали

Один простой вопрос. Девять уверенных ответов. Восемь из них — ложьДва слова. Пустой системный промпт. Ноль контекста.Я отправил 29 крупнейшим языковым моделям одно сообщение: current date

продолжить чтение

Мы протестировали 22 нейросети на задачах для российских учителей. Ни одна не знает чувашский

Я живу в Чебоксарах и запускаю ИИ-пилот в местной школе. Когда понадобилось проверить, какие LLM действительно способны помочь российским учителям в их работе — оказалось, что бенчмарка для этого не существует. MERA тестирует, может ли модель решить задания ЕГЭ. EduBench — только английский и китайский. Российское образование — это ФГОС, технологические карты уроков, ОГЭ, чувашский язык — и ничего из этого ни один бенчмарк не покрывает.Мы сделали EduBench-RU — первый бенчмарк для оценки LLM на задачах российского образования в школах. 50 промптов, 22 модели, двойная оценка. И нашли кое-что неожиданное.Что внутри

продолжить чтение

OpenAI закрывает нейросеть Sora для генерации видео

OpenAI сообщила в социальной сети X о том, что закрывает нейросеть Sora. В ближайшее время компания более детально расскажет о том, когда прекратит работу официальное приложение и API.

продолжить чтение

Atlassian уволила 1 600 человек и сказала, что «дела идут хорошо». Кто выигрывает от замены людей на ИИ?

Думаю, можно уже сказать прямо: массовые увольнения в tech-секторе — это ужасная идея.Согласны? Да, знаю. Согласиться легко.

продолжить чтение

Топ-13 бесплатных нейросетей для генерации презентаций в 2026 году

Март не так часто балует нас громкими новинками, как хотелось бы, но индустрия не стоит на месте. В прошлой статье я рассказывал о ИИ-инструментах/агентах/сервисах для программистов, и в процессе размышлений у меня родилась идея для нового материала.В своих сравнительных статьях о топовых LLM я обычно делаю упор на рутинные задачи: генерацию текста, программирование и математику. Но спектр таких задач гораздо шире. Именно эта мысль привела меня к теме сегодняшней статьи.

продолжить чтение

Open-source персистентная память для LLM

Последние полгода я занимаюсь задачей, которая поначалу казалась тривиальной: научить LLM помнить, с кем она разговаривает.Задача звучит просто. На практике — нет.Если вы строили чат-бот или AI-агента, вы знаете ощущение: пользователь написал, что он вегетарианец, а через три сообщения модель предлагает ему стейк-хаус. Или пациент сообщил об аллергии на пенициллин, а ассистент через час забыл и порекомендовал амоксициллин. В рамках одного контекстного окна всё работает. Но стоит начать новую сессию — чистый лист, модель не помнит ничего.Написал NGT Memory

продолжить чтение

В России представили первую открытую методологию тестирования RAG‑систем

Исследователи из Сбера (команда SberAI), МТС Web Services (MWS AI) и ведущих российских и международных вузов разработали первую открытую динамическую методологию тестирования русскоязычных систем генеративного ИИ с поиском (RAG). Работу приняли на EACL 2026 — одну из крупнейших конференций по компьютерной лингвистике, которая проходит с 24 по 29 марта 2026 года в Рабате (Марокко), рассказали Хабру в МТС.

продолжить чтение

Как ML изменит бизнес в 2026 году: прогноз Selectel, GlowByte и Data Sapience

продолжить чтение

1...234567...2030...394
Rambler's Top100