AI-суперапп – главный тренд 2026 по версии Forbes. Что мы видим из GPTunneL с позиции 2 млн пользователей
В декабре я рассказал на Хабре, как GPTunneL вырос от прототипа до 1,5 млн пользователей. С тех пор нас стало 2 млн. Подумал – пора рассказать, что мы делаем сейчас и куда идём. Хабр для этого хорошее место.Если коротко: строим и обучаем собственную модель GROM, развиваем GraphRAG, Creative Lab, vibe-coding, работаем над оркестрацией 100+ моделей через единый интерфейс. Под всё это – ML-команда, начинаем строить инфраструктуру под претрейн, прямые партнёрства с MiniMax, ByteDance, Alibaba, Сбером и рядом других поставщиков моделей – как китайских, так и западных.
CLAUDE AI (КЛАУД): что умеет нейросеть и как использовать ее в работе?
Claude AI: что умеет нейросеть и как использовать ее в работе
ChatGPT 5.4 Pro: обзор, бенчмарки, сравнение
Помните, как пару лет назад мы восхищались тем, что нейросеть может написать связный абзац? А год назад – что она осилила код без синтаксической ошибки? Сегодня планка взлетела так высоко, что уникальные способности моделей превращаются в стандартный пакет услуг.
Техдиректор Microsoft Azure с помощью Claude AI обнаружил ошибки в 40-летнем коде Apple II
Технический директор Microsoft Azure Марк Руссинович заявил об успешной реконструкции и поиске уязвимостей в старом коде с помощью ИИ. Он привёл в качестве примера собственный код Apple II 40-летней давности.
Your AI Should Be Writing Tests. The Unfair Advantage Every Vibe Coder Ignores
A test is a note you leave for the computer. It says: "this thing works like this, and if it ever stops working like this, let me know."That's it. Imagine you built a calculator. You write a note that says "2 + 3 must equal 5." The computer checks this note every time something changes. If your calculator suddenly returns 6, the note fires. You don't need to understand how the calculator works internally. You just know it's broken because 2 + 3 is not 6.This is the entire concept.What a test looks like in practiceBefore any code, here's the plain-English version:I have a function called calculatePrice. I give it an item that costs $10 and a quantity of 3. I expect $30 back. If I get anything else, something is wrong.In Go, that becomes:func TestCalculatePrice(t *testing.T) { got := calculatePrice(10, 3) if got != 30 { t.Errorf("expected 30, got %d", got) } }
Нейросети Claude в России: Opus 4.6, Sonnet, Haiku. Как использовать и выбрать ИИ
Как использовать в России нейросети Claude без VPN. Обзор Claude Opus 4.6, Sonnet, Haiku: тесты, возможности, фишки и удобные способы оплаты.
Gemini 3.1 Pro обошел Claude и GPT в рейтинге интеллекта, но главный сюрприз – в цене
Согласно свежим данным Artificial Analysis, модель Gemini 3.1 Pro Preview не только возглавила рейтинг Intelligence Index (показатель совокупного интеллекта), но и превзошла конкурентов по соотношению цены и качества.Цифры говорят сами за себя. Чтобы прогнать модель через все тесты Intelligence Index, Gemini потребовалось всего 56 млн токенов. Для сравнения: GPT-5.2 (версия xhigh – максимальный уровень размышлений) съел 130 млн, а Claude Opus 4.6 (max) – 58 млн. Разница с Opus невелика, но тут в дело вступает ценообразование.
Anthropic против OpenAI: два разных подхода к «быстрому режиму»
Недавно Anthropic и OpenAI объявили о запуске «быстрого режима» — способа работать с их лучшей моделью для программирования на значительно более высокой скорости.Эти два варианта устроены совершенно по-разному. У Anthropic скорость достигает 2,5× токенов в секунду (примерно 170 вместо 65 у Opus 4.6). У OpenAI — более 1000 токенов в секунду (вместо 65 у GPT-5.3-Codex, то есть ускорение в 15 раз). Таким образом, быстрый режим OpenAI примерно в шесть раз быстрее, чем у Anthropic
$118 за одно сообщение в Cursor: почему ИИ-агенты сжигают ваши деньги
Пользователь Reddit пожаловался на то, как Курсор списал с него 118 долларов за ОДНО сообщение. Не за день работы, не за неделю, а за один запрос. Захотелось разобраться, как такое вообще возможно, почему это будет происходить все чаще, и что с этим делать. Что произошло?
Сравнение LLM по навыку анализа бизнес-процессов
Всё чаще аналитики бизнес-процессов используют LLM для поиска неэффективностей. Звучит логично: большие языковые модели умеют искать паттерны, а Process Mining как раз об этом. Но на практике результаты пляшут так, что становится понятно: не все LLM одинаково полезны для операционной аналитики. Решил разработать методологию тестирования LLM на предмет релевантности использования для задач анализа процессов.Было подготовлено три теста, имитирующих реальные сценарии анализа:Тест 1. Сырой лог событий.

