Я заставил 14 нейросетей врать: Большой аудит галлюцинаций 2026
Или как я потратил неделю, чтобы доказать: ИИ сегодня — это красноречивые лжецы в костюмах экспертов.В конце 2025 года я устал читать маркетинг в стиле «наша модель умнее ChatGPT на 15%». Умнее по какому бенчмарку? MMLU? Это всё равно что мерить интеллект человека по результатам ЕГЭ.Я решил проверить одну простую вещь: способна ли нейросеть сказать «я не знаю»?Потому что в реальном мире — в медицине, праве, финансах — ответ «я не уверен» стоит дороже любой красивой, но выдуманной истории.Ниже — результаты слепого тестирования 14 топовых LLM (включая Claude 4.5, GPT-5.2, Gemini 3, Qwen, YandexGPT и
Синдром бесконечного окна: почему 1 миллион токенов в LLM не решает ваши проблемы (пока)
Привет, Хабр! Меня зовут Сергей Нотевский, я AI Platform Lead в Битрикс24.Год назад индустрия жила лозунгом «Scale is all you need», перекладывая его на размер контекстного окна. 32k казались прорывом, 128k - стандартом, а Gemini с 1M+ токенов - убийцей RAG.Сейчас, в 2025-м, я вижу, как этот миф разбивается о реальность. Разработчики пихают в промпт целые книги, логи за неделю и дампы баз данных, а на выходе получают галлюцинации и «кашу».Давайте вооружимся свежими бенчмарками и разберемся, почему «поддерживаемый контекст» ≠ «рабочий контекст», что такое Context Rot (гниение контекста) и как с этим жить.1. Маркетинг vs Физика Attention
Как повысить свою продуктивность с генеративным ИИ (и почему это не ChatGPT)
Если ты управляешь даже небольшой командой, то знаешь: каждая минута на счету, а цена ошибки — заоблачная. Мы живем в мире, где стратегическое решение нужно принять не через неделю, а «вчера». И тут на сцену выходит ИИ. Но я не собираюсь рассказывать, как попросить ChatGPT написать за тебя письмо или пост в ТГ-канал (об этом прочитаешь в других медиа).Речь о стратегическом усилении, которое помогает мне, как CEO, принимать решения быстрее и точнее. Это процесс, который может настроить под себя каждый за несколько вечеров, чтобы потом сэкономить сотни часов.
Домен-специфичные LLM: как сделать ИИ реально полезным для вашего бизнеса
Универсальные модели вроде GPT хорошо справляются с широким классом задач, но буксуют в узких доменах. Они не знают специфику нишевых индустрий, их жаргон и не имеют доступа к проприетарным знаниям, которые делают ваш бизнес уникальным. Когда нужна система ИИ, которая действительно «понимает» именно вашу предметную область, стоит выбирать домен-специфичные LLM (DSLM).Gartner отмечает, что одной из двух крупнейших тем ИИ с завышенными ожиданиями сейчас являются AI-ready data («данные, готовые к ИИ»).
Prompt Engineering: Паттерны проектирования. Часть 1 — XML теги
Prompt Engineering все еще остается ключевым элементом в разработке приложений на базе LLM. По мере того как индустрия движется от экспериментов к созданию продуктов, возникает потребность в лучших практиках и проверенных паттернах. Чтобы найти их, лучшим методом является постоянный анализ существующих топовых решений. В ходе масштабного исследования были проанализированы системные промпты из публичного репозитория
LLM передают ИИ в руки гуманитариев
Встреча с Богом (х/ф "Космическая Одиссея 2001")
Prompt engineering от А до Я: как получать максимум от ИИ с примерами и советами
Привет, жители Хабра!В постоянно развивающемся мире каждый день приходится осваивать новые технологии: от новых функций в Telegram до автоматизации бизнес-процессов и блокчейна. Как говорил Джек Ма: В будущем 90% рабочих мест будут связаны с технологиями. Если вы не хотите остаться позади, начните изучать их уже сегодня. Не бойтесь ошибаться — бойтесь бездействоватьСпорим, каждый из вас хотя бы раз пользовался языковыми моделями — ChatGPT, DeepSeek, GigaChat? А кто-то применяет их ежедневно или даже сделал частью работы. Но умеете ли вы правильно с ними общаться?
Всё-в-одном: Чек-лист по работе с ИИ и ChatGPT
Эта статья будет полезна продактам, маркетологам, разработчикам всем, кто ищет способ ускорить работу или облегчить её с помощью генеративного искусственного интеллекта.Введение
AutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеров
Всем привет! Интересно, что на Хабре статьи по этой теме я не смог найти.

