Claude Sonnet 4.6.

Claude Sonnet 4.5 vs Claude Sonnet 4.6: сравнение в генерации текста

Все уже знают, что в феврале от Claude вышли модели версии 4.6. Я попытался сравнить Opus и Sonnet, но результат оказался каким-то невнятным. Тогда родился вопрос: а что, если сравнивать не горизонтально, а вертикально? Ведь для меня Sonnet – это прежде всего генерация текста. Раньше, на версии 4.5, он делал это на хорошем уровне. А что же сейчас?

продолжить чтение

Галлюцинации недели: Gemini 3.1 Pro, Sonnet 4.6 в бою и новый дом llama.cpp

Google бросает перчатку, Anthropic сканирует чужой код, а моделям выдают фудтраки и деньги на бизнес. Приглядимся ко всему по порядку.Google выпустил Gemini 3.1 Pro. Как обычно, мы видим красивые бенчмарки: ARC-AGI-2 вырос с 31% до 77%, SWE-Bench Verified 80,6%. По соотношению цены и заявленного качества модель очень интересная, а ещё она умеет такое.В реальной работе не всё гладко. Бывший сотрудник Google на

продолжить чтение

Как читать новости об ИИ и отличать прорыв от пресс-релиза. И как относиться к заголовкам про «ИИ отнимет работу»

Схема: из чего состоит релиз модели LLM (пост → model/system card → методика → цена → независимые

продолжить чтение

Claude Sonnet 4.6 vs ChatGPT 5.2: кто же лучше?

продолжить чтение

Anthropic представила Claude Sonnet 4.6

продолжить чтение

Anthropic выпустила Claude Sonnet 4.6 с контекстом в 1 млн токенов

Anthropic представила Claude Sonnet 4.6 — обновлённую версию своей «средней» модели, которая по ряду задач уже приближается к уровню Opus.Теперь Sonnet 4.6 — модель по умолчанию в claude.ai

продолжить чтение