LLM бенчмарк «Испытание Дали»
Обложка нарисована в ChatGPT Image-2Помните анекдот?— Что вы умеете лучше всего? — Я очень быстро считаю. — Сколько будет 758×652÷9? — 22! — Но это же неправильно! — Зато очень быстро.
Сэм Альтман: Anthropic использует для продвижения Claude Mythos маркетинг, основанный на страхе
Генеральный директор OpenAI раскритиковал
Anthropic запустила ИИ-маркетплейс, где нейросети продавали и покупали реальные товары за настоящие деньги
Anthropic создала
Слишком опасен, чтобы показать? Что скрывается за запуском Claude Mythos
Опасный ИИ? Маркетинговый трюк? Или своеобразная «крыша»?Чуть больше недели назад Anthropic представила миру свою модель Claude Mythos
Мысли об одной продуктовой ошибке подавляющего большинства GenAI компаний
Мало кто имеет возможность обучить конкурентноспособную LLM с нуля. Тем не менее спрос на использование больших языковых моделей - огромный. Такая ситуация на рынке дает возможность организациям продавать доступ к LLM’кам и продуктам вокруг них на выгодных условиях. Чтобы извлечь максимум пользы, организации берут деньги с пользователей по двум разным моделям монетизации:Подписочная
Могут ли Claude Skills заменить Playwright-агентов? Практический взгляд для QA-инженеров
AI в тест-автоматизации развивается стремительно, и все пробуют связку Claude Skills с Playwright, чтобы сделать QA-инжиниринг эффективнее.Часто встречающийся вопрос звучит так:Если реализовать планировщик, исполнитель и «хилер» через Claude Skills, будет ли это эквивалентом Playwright-агента?На первый взгляд кажется, что да. Если система умеет планировать шаги, прогонять тесты и чинить падения автоматически, что ещё нужно?Но в реальности всё чуть сложнее.
Что я вынес из AMA с инженером Anthropic: 12 инсайтов про Claude Code, которые нигде не написаны
Прямо сейчас идет Built with Opus 4.7: a Claude Code hackathon. Было более 20 тысяч заявок, отбор прошли менее 2% и я стал одним из тех, кому посчастливилось попробовать свои силы и получить API токенов на $500 (но об этом в другой раз). Так вот сегодня был AMA с Thariq Shihipar, одним из инженеров, который работает с Claude Code. Не маркетинговый вебинар, а живой разговор с человеком, который сам пишет skills, крутит loops и дебажит CLAUDE.md каждый день. Ниже то, что я записал и проверил на своих проектах.1. Skills, а не агентыГлавный тезис, который Tharik повторил несколько раз: skills это primary extension point для Claude Code. Не агенты, не MCP-серверы, не промпты в CLAUDE.md.
Как устроен AI-агент изнутри
«Любая достаточно развитая обвязка неотличима от магии» — перефразированный Кларк, после недели ковыряния в исходниках.Внимание! Много букв, читать и познавать только для собственного развития в области работы AI-агентов.Последний год в тему AI-ассистентов для кода заходят буквально все — от одиночных разработчиков до крупных команд, у которых бюджеты на облачные модели уже сопоставимы с зарплатами джунов. Одни работают через веб-интерфейс, другие — через IDE-плагины, а третьи — прямо в терминале, в виде CLI-агента.
Anthropic тестирует отключение Claude Code для части новых Pro-подписчиков
Компания Anthropic начала эксперимент: на странице тарифов у новых пользователей из Pro-плана временно убрали Claude Code.
Anthropic случайно показали свои планы на Claude Code
https://x.com/TheAmolAvasare/status/2046724659039932830Вчера на странице цен claude.com/pricing у Claude Code в колонке Pro ($20/мес) появился красный крестик. Без анонса, без changelog. Минимальным планом с Claude Code

