Модели почти год, а она всё ещё №1 по цене-качеству. Прогнал свежий батл-тест — и опять не сдвинул
Собрал четыре модели в один батч — одна сессия, один судья, те же пять тем. Сравнивать баллы из разных тестов нельзя: разница в пару баллов между сессиями — это шум, а не сигнал.qwen/qwen3-235b-a22b-2507 снова №1 по цене/качеству (value 91.6). Модель вышла 21 июля 2025 — почти год назад. Рынок несколько раз перетряхнуло, а она с трона не сдвинулась.DeepSeek V4 Flash был недооценён на 6 баллов. В апреле у меня стоял 83, в честном батче — 89, сильнейший по качеству из четырёх. Аутсайдер оказался лидером.Мнимый сюрприз развеялся.
Промпт — это творчество? Нет, это 10 блоков в жёстком порядке
Меня зовут Максим Никитин, я фаундер небольшой, но гордой студии разработки сложных и нетиповых проектов ITSalt. Большую часть прошлого года мы переводили разработку на агентов и по дороге собрали собственный фреймворк
Руководители OpenAI призвали не стремиться к полной автоматизации мира с помощью ИИ
Руководство компании OpenAI считает, что не нужно стремиться к полной автоматизации мира с помощью искусственного интеллекта. Гендиректор Сэм Альтман и главный научный сотрудник Якуб Пахоцкий заявили, что «отчётливо понимают риски», несмотря на все преимущества ИИ для продуктивности.
Я попросила Claude Fable 5 сделать игру одним промптом. Получился симулятор админа ИИ-канала
9 июня Anthropic выпустила Claude Fable 5 - первую публичную модель класса Mythos, на ступень выше привычного Opus. Релиз громкий: 80,3% на SWE-bench Pro, миграция кодбазы Stripe за день, "самая мощная публичная модель в истории компании".Но бенчмарки - это чужой опыт. Мне было интереснее проверить свое: может ли модель не просто написать кусок кода, а собрать маленький продукт целиком - с идеей, механикой, балансом, интерфейсом и концовками.
Инженера xAI уволили из-за опасений по поводу безопасности Grok
Бывший инженер компании xAI Девин Ким подал иск против компании и SpaceX, утверждая, что его уволили за высказывание опасений по поводу безопасности ИИ. Он покинул xAI в сентябре 2025 года. Иск поступил в суд штата Калифорния.

