Claude Opus 4.6.

ChatGPT 5.4 Pro: обзор, бенчмарки, сравнение

Помните, как пару лет назад мы восхищались тем, что нейросеть может написать связный абзац? А год назад – что она осилила код без синтаксической ошибки? Сегодня планка взлетела так высоко, что уникальные способности моделей превращаются в стандартный пакет услуг.

продолжить чтение

Техдиректор Microsoft Azure с помощью Claude AI обнаружил ошибки в 40-летнем коде Apple II

Технический директор Microsoft Azure Марк Руссинович заявил об успешной реконструкции и поиске уязвимостей в старом коде с помощью ИИ. Он привёл в качестве примера собственный код Apple II 40-летней давности.

продолжить чтение

Your AI Should Be Writing Tests. The Unfair Advantage Every Vibe Coder Ignores

A test is a note you leave for the computer. It says: "this thing works like this, and if it ever stops working like this, let me know."That's it. Imagine you built a calculator. You write a note that says "2 + 3 must equal 5." The computer checks this note every time something changes. If your calculator suddenly returns 6, the note fires. You don't need to understand how the calculator works internally. You just know it's broken because 2 + 3 is not 6.This is the entire concept.What a test looks like in practiceBefore any code, here's the plain-English version:I have a function called calculatePrice. I give it an item that costs $10 and a quantity of 3. I expect $30 back. If I get anything else, something is wrong.In Go, that becomes:func TestCalculatePrice(t *testing.T) { got := calculatePrice(10, 3) if got != 30 { t.Errorf("expected 30, got %d", got) } }

продолжить чтение

Нейросети Claude в России: Opus 4.6, Sonnet, Haiku. Как использовать и выбрать ИИ

Как использовать в России нейросети Claude без VPN. Обзор Claude Opus 4.6, Sonnet, Haiku: тесты, возможности, фишки и удобные способы оплаты.

продолжить чтение

Gemini 3.1 Pro обошел Claude и GPT в рейтинге интеллекта, но главный сюрприз – в цене

Согласно свежим данным Artificial Analysis, модель Gemini 3.1 Pro Preview не только возглавила рейтинг Intelligence Index (показатель совокупного интеллекта), но и превзошла конкурентов по соотношению цены и качества.Цифры говорят сами за себя. Чтобы прогнать модель через все тесты Intelligence Index, Gemini потребовалось всего 56 млн токенов. Для сравнения: GPT-5.2 (версия xhigh – максимальный уровень размышлений) съел 130 млн, а Claude Opus 4.6 (max) – 58 млн. Разница с Opus невелика, но тут в дело вступает ценообразование.

продолжить чтение

Anthropic против OpenAI: два разных подхода к «быстрому режиму»

Недавно Anthropic и OpenAI объявили о запуске «быстрого режима» — способа работать с их лучшей моделью для программирования на значительно более высокой скорости.Эти два варианта устроены совершенно по-разному. У Anthropic скорость достигает 2,5× токенов в секунду (примерно 170 вместо 65 у Opus 4.6). У OpenAI — более 1000 токенов в секунду (вместо 65 у GPT-5.3-Codex, то есть ускорение в 15 раз). Таким образом, быстрый режим OpenAI примерно в шесть раз быстрее, чем у Anthropic

продолжить чтение

$118 за одно сообщение в Cursor: почему ИИ-агенты сжигают ваши деньги

Пользователь Reddit пожаловался на то, как Курсор списал с него 118 долларов за ОДНО сообщение. Не за день работы, не за неделю, а за один запрос. Захотелось разобраться, как такое вообще возможно, почему это будет происходить все чаще, и что с этим делать. Что произошло?

продолжить чтение

Сравнение LLM по навыку анализа бизнес-процессов

Всё чаще аналитики бизнес-процессов используют LLM для поиска неэффективностей. Звучит логично: большие языковые модели умеют искать паттерны, а Process Mining как раз об этом. Но на практике результаты пляшут так, что становится понятно: не все LLM одинаково полезны для операционной аналитики. Решил разработать методологию тестирования LLM на предмет релевантности использования для задач анализа процессов.Было подготовлено три теста, имитирующих реальные сценарии анализа:Тест 1. Сырой лог событий.

продолжить чтение

Сравнение ИИ-гигантов: ChatGPT 5.2 vs Gemini 3 Pro vs Claude Opus 4.6

Stop. Хватит читать обзоры бенчмарков.Они не расскажут, почему ChatGPT увидел 127 точек, а Gemini – только 57. Не объяснят, зачем Claude добавил рекламу в игру, которая должна была быть “просто раздражающей”.

продолжить чтение

Moltbook оказался спектаклем: самые вирусные посты ботов писали люди

MIT Technology Review разобрал феномен

продолжить чтение

12
Rambler's Top100