Когда ИИ не знает – но делает вид, что знает: ударим энтропией по LLM
Представьте: вы спрашиваете умного коллегу о дедлайне проекта, а он отвечает уверенно и детально – но на самом деле придумывает всё на ходу. Именно это постоянно делают большие языковые модели. Они не «знают», что не знают. И это не баг конкретной реализации – это фундаментальное свойство архитектуры.
Все демонические насельники ИИ… по старшинству
Гоблины, призраки, монстры, богини: фантастические твари и где они обитают.В конце апреля OpenAI опубликовала у себя в блоге пост, в котором объяснила, почему модели OpenAI то и дело говорят о гоблинах. А также о гремлинах.
Сикофантия? Или ускорение динамического пересчета определителя от O(n³) до O(n)?
Всем привет. Хотел бы поделиться своими результатами и обратиться за ответным мнением.
Golden Armada: трассировки как основа наблюдаемой AI-native системы
Введение В предыдущей статье я описал идею изменения парадигмы программирования в условиях, когда значительная часть кода начинает генерироваться LLM. 👉 Предыдущая статьяТам основная мысль была следующая: код перестаёт быть единственным источником истины, а роль разработчика смещается в сторону архитектуры, контрактов и ограничений. В этой статье я хочу показать следующий шаг — не концепцию, а реализацию. 🌲 От теории к наблюдаемой системе Если предыдущий текст был про “как должно быть”, то Golden Armada — это попытка ответить на вопрос:
Ни одна ошибка не нова: почему провал ИИ в First Proof был предсказуем заранее
В начале июня 2026 вышли результаты First Proof Second Batch — первого бенчмарка, который одновременно: (1) состоит из исследовательских задач, (2) заведомо не встречавшихся в обучающих данных, и (3) проверяется живыми математиками вслепую по правилам журналов.Заголовки привычно написали: «ИИ провалил тест по математике». Но самое интересное в отчёте — не счёт, а то, что ни один тип ошибок не нов. Каждую можно было предсказать заранее из классических работ о математическом мышлении и надёжности проверок. Если сложить эти источники, результаты First Proof перестают удивлять.
О конференции OpenTalks.AI 2026: мои впечатления и 5 полезных докладов
Я руковожу практикой машинного обучения Центра компетенций больших данных и искусственного интеллекта в ЛАНИТ. Также под моим началом трудится команда ИИ-платформы для управления корпоративным искусственным интеллектом LANDEV AI. Мы занимаемся ML и AI уже больше пяти лет, поддерживаем другие бизнес-подразделения группы компаний в этой области. Когда я ехал в Белград на конференцию OpenTalks AI 2026, я преследовал сразу две цели: презентовать собственное решение, а также понять, какие актуальные темы можно применить на практике в наших проектах. Ну и, конечно, пообщаться с коллегами, которые сейчас разбросаны по всему миру.
Верификация программного обеспечения в эпоху искусственного интеллекта
Перевод доклада Бертрана Мейера (Eiffel Software, Recognyze AI) с ACM Technology Talk, 7 мая 2026 г. Отредактированная стенограмма и раздаточный материал. Более структурированное изложение — в статье «От вероятного к доказуемому» (Communications of the ACM, июнь 2026) и в готовящейся книге «Понимание искусственного интеллекта: триумф эмпиризма».От переводчика. Это перевод митап-доклада Бертрана Мейера — создателя языка Eiffel и концепции «проектирования по контракту», автора классического «Object-Oriented Software Construction». Доклад показался мне прямым продолжением (
Рождение LLM: история, которую мало кто знает
Когда люди слышат "языковая модель", у большинства сразу всплывает ChatGPT, Gemini, ну или на худой конец что-то связанное с Яндексом. Но мало кто задумывается - а с чего вообще всё началось? Кто первым решил, что машина может понимать текст не по шаблону, а по-настоящему?Я попробую рассказать эту историю без лишнего академизма - просто, но честно.До нейросетей была статистикаКонец 1980-х. Никаких тебе трансформеров, никакого обучения с подкреплением. Тогда языковые модели строились на банальной статистике - модель просто смотрела, какое слово чаще всего следует за предыдущим. Это называлось n-граммными моделями.
Anthropic открыла доступ к Claude Fable 5 — модель уже в BotHub
Anthropic сделала публичной самую мощную модель — Claude Fable 5. Это «безопасная» версия нашумевшей Mythos, которую до сих пор не выпускали за пределы узкого круга партнёров10 июня Anthropic официально открыла доступ к модели Claude Fable 5. Это первый случай, когда версия флагманской архитектуры Mythos попала в руки широкой аудитории, хоть и с серьёзными ограничениями. Полноценная Claude Mythos 5 остаётся закрытой и доступна только по спецразрешениям — именно её появление в начале года вызвало экстренные консультации в Белом доме.

