- BrainTools - https://www.braintools.ru -
2025-й войдёт в историю как год, когда AI перестал «отвечать» и начал «делать». Модели научились рассуждать по бюджету, агенты захватили браузеры и терминалы, а видео и голос превратились из демок в часть инфраструктуры. Собрали 25 ключевых событий, разбитых по 10 главным трендам года.

2025-й — год, когда чат окончательно превратился в исполнителя: модели планируют, вызывают инструменты, выполняют действия.
OpenAI превратила Responses API в единый control plane для агентов [1]: MCP-серверы, tool-use прямо в reasoning, File Search, Code Interpreter, генерация изображений и background mode для долгих задач — всё в одном интерфейсе.
ChatGPT Agent получил доступ к браузеру, терминалу и «своему компьютеру» [2]: агентный режим теперь не демка, а продукт — доступен Plus/Pro/Team с региональными ограничениями.
Anthropic запустила Claude Integrations с упором на длинные задачи [3]: коннекторы как продукт, MCP-плагины для сервисов, усиление «исследовательских» сценариев со сбором контекста из разных источников.
Google представила A2A — протокол для общения агентов разных производителей [4]: Agent2Agent как попытка создать общий язык межагентного взаимодействия, Microsoft заявила поддержку.
Качество растёт не только за счёт размера, но и через умение рассуждать и управлять глубиной мышления [5].
OpenAI упростила модельный выбор [6]: GPT-5 стал основным флагманом с быстрым и «глубоким» режимами и авто-роутингом задач — упор на код, мультимодальность и следование инструкциям.
Reasoning-модели научились вызывать инструменты в ходе решения задачи [1]: в Responses API o-линейка (o3, o4-mini) получила tool calling внутри агентного цикла, а не «после ответа».
Gemini 2.5 Pro/Flash получили контекст до 1M токенов и регулятор размышлений [7]: thinking budget как ручка управления — когда надо быстро, модель думает быстро, когда надо глубоко — глубоко.
DeepSeek-R1 стал новой базой сравнения для открытых моделей [8]: китайская open-weight reasoning-модель доказала, что reasoning масштабируется не только размером, но и пост-тренингом.
Если 2024 был про Copilot-подсказчик, то 2025 — про постановку задач агенту и контроль результата.
Vibe coding стал термином года [9]: формула «я задаю намерение → агент пишет/правит → я проверяю» стала массовой практикой.
OpenAI Codex превратился в код-агента с песочницей [10]: изолированная среда, параллельные задачи, упор на сквозную работу с репозиторием — от автодополнения к исполнителю.
Cursor 2.0 сделал IDE оркестратором нескольких агентов [11]: до 8 агентов параллельно, разные модели, изолированные окружения через git worktrees, контроль диффов и безопасный терминал.
Qwen3-Coder бросил вызов закрытым IDE-агентам [12]: open-weight код-агент с agentic coding, tool use, browser use — контекст до 1M токенов, MoE-архитектура.
Видео и голос перестали быть демками и превратились в инфраструктуру: API, цены, лимиты, прод-сценарии.
Sora 2 стала платформой, а не просто генератором роликов [13]: продуктовый формат с cameos, сценариями и выходом к API через партнёрские интеграции.
Veo 2 появилась в Gemini API с понятной экономикой [14]: 8 секунд, 720p, цена за секунду — видео-генерация как прод-сервис в dev-экосистеме Google.
gpt-realtime вышел в GA с SIP и MCP [15]: speech-to-speech в одной модели, низкие задержки, удалённые MCP-серверы, изображения на входе, точный function calling — голосовые агенты стали реальностью.
Параллельно с гонкой флагманов рынок полюбил узкие, дешёвые модели с понятной ценностью.
Mistral OCR сделал документы отдельным классом задач [16]: OCR для рукописей, форм и таблиц с прозрачной экономикой — $2 за 1 000 страниц ($1 в Batch-режиме).
Microsoft Mu показала, зачем нужны специализированные малые модели [17]: 330M параметров, работа на NPU, быстрые ответы без облака — «внутренний агент» Windows для помощи с настройками.
Китайские релизы 2025-го — это уже не «догнать», а давление темпом: много моделей, много открытости, инженерия эффективности.
Qwen 3 сделал thinking/non-thinking штатной функцией [18]: семейство dense+MoE, переключаемые режимы вывода, thinking budget как ручка управления стоимостью/качеством, расширенная многоязычность.
ERNIE 4.5 от Baidu вышел под Apache-лицензией [19]: пакет моделей включая крупные MoE, сильная мультимодальность, ориентация на deployment-стек — плюс Moonshot/Kimi тоже выкатили открытые веса, усиливая волну открытых релизов из Китая.
Тренд года — не один «умный чат», а связка модель + сценарии + интеграции + цена.
YandexGPT 5.1 Pro нацелился на корпоративные сценарии [20]: RAG, работа с документами и отчётами, меньше галлюцинаций — упор на контролируемость и понятную экономику.
GigaChat 2.0 вырос до «200 страниц» контекста [21]: в 4 раза больше контекста, лучшее следование инструкциям, опции облачного и локального развёртывания.
Sber выложил open-компоненты [22]: Giga-Embeddings для RAG и Kandinsky Video Lite для генерации видео.
На уровне железа 2025-й — это уже не только «тренируем», а «как масштабируем инференс для миллиардов запросов».
Blackwell Ultra + TPU Ironwood задали вектор на массовый инференс [23]: NVIDIA продвигает концепт AI Factory для генерации в промышленных масштабах, Google показывает TPU Ironwood как специализированный инференс-ускоритель — тема энергопотребления стала узким местом в публичных обсуждениях.
Если в 2023–24 RAG был приёмом, то в 2025 он стал отдельным продуктовым слоем.
Fully-managed RAG стал стандартом [24]: Google продвигает File Search Tool как managed-сервис — загрузка, индексация, поиск через API. OpenAI усиливает аналогичную логику [25] через File Search в Responses API — «агент с документами» собирается без ручной инженерии.
Когда синтетики много, нужны технические маркеры доверия и практики оценки рисков.
Индустрия выстраивает provenance-слой [26]: C2PA v2.2 обновляет спецификации происхождения медиа, Google раскатывает SynthID для детекта синтетики, OpenAI и Anthropic делают взаимные кросс-оценки безопасности моделей — редкий, но важный сигнал зрелости.
2025-й стал годом перехода от «модель отвечает» к «модель делает»: DeepSeek показал, что open-weight модели конкурируют по reasoning-качеству, MCP стал де-факто одним из главных протоколов интеграций, vibe coding изменил культуру разработки, а агенты захватили браузеры, терминалы и IDE. Железо догоняет софт — Blackwell и Ironwood задают вектор на массовый инференс.
Какой тренд 2025 года оказался для вас самым неожиданным? Делитесь в комментариях!
Автор: tochka_team
Источник [27]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/23849
URLs in this post:
[1] OpenAI превратила Responses API в единый control plane для агентов: https://openai.com/index/new-tools-and-features-in-the-responses-api
[2] ChatGPT Agent получил доступ к браузеру, терминалу и «своему компьютеру»: https://openai.com/index/introducing-chatgpt-agent
[3] Anthropic запустила Claude Integrations с упором на длинные задачи: https://www.anthropic.com/news/integrations
[4] Google представила A2A — протокол для общения агентов разных производителей: https://www.microsoft.com/en-us/microsoft-cloud/blog/2025/05/07/empowering-multi-agent-apps-with-the-open-agent2agent-a2a-protocol
[5] мышления: http://www.braintools.ru/thinking
[6] OpenAI упростила модельный выбор: https://openai.com/index/introducing-gpt-5/
[7] Gemini 2.5 Pro/Flash получили контекст до 1M токенов и регулятор размышлений: https://developers.googleblog.com/en/gemini-2-5-flash-pro-live-api-veo-2-gemini-api%5D
[8] DeepSeek-R1 стал новой базой сравнения для открытых моделей: https://techcrunch.com/2025/05/28/deepseek-updates-its-r1-reasoning-ai-model-releases-it-on-hugging-face/
[9] Vibe coding стал термином года: https://venturebeat.com/ai/googles-new-vibe-coding-ai-studio-experience-lets-anyone-build-deploy-apps/
[10] OpenAI Codex превратился в код-агента с песочницей: https://openai.com/index/introducing-codex
[11] Cursor 2.0 сделал IDE оркестратором нескольких агентов: https://cursor.com/blog/2-0
[12] Qwen3-Coder бросил вызов закрытым IDE-агентам: https://qwenlm.github.io/blog/qwen3-coder/
[13] Sora 2 стала платформой, а не просто генератором роликов: https://openai.com/index/sora-2/
[14] Veo 2 появилась в Gemini API с понятной экономикой: https://developers.googleblog.com/en/gemini-2-5-flash-pro-live-api-veo-2-gemini-api
[15] gpt-realtime вышел в GA с SIP и MCP: https://openai.com/index/introducing-gpt-realtime/
[16] Mistral OCR сделал документы отдельным классом задач: https://mistral.ai/news/mistral-ocr-3
[17] Microsoft Mu показала, зачем нужны специализированные малые модели: https://blogs.windows.com/windowsexperience/2025/06/23/introducing-mu-language-model-and-how-it-enabled-the-agent-in-windows-settings/
[18] Qwen 3 сделал thinking/non-thinking штатной функцией: https://github.com/QwenLM/Qwen3/blob/main/Qwen3_Technical_Report.pdf
[19] ERNIE 4.5 от Baidu вышел под Apache-лицензией: https://ernie.baidu.com/blog/posts/ernie4.5/
[20] YandexGPT 5.1 Pro нацелился на корпоративные сценарии: https://yandex.ru/company/news/28-08-2025-01
[21] GigaChat 2.0 вырос до «200 страниц» контекста: https://www.sberbank.com/ru/news-and-media/press-releases/article?newsID=50dce36e-befd-431d-9633-6e19ed7a1a76&blockID=7®ionID=34&lang=ru&type=NEWS
[22] Sber выложил open-компоненты: https://habr.com/ru/news/952096/
[23] Blackwell Ultra + TPU Ironwood задали вектор на массовый инференс: https://nvidianews.nvidia.com/news/nvidia-blackwell-ultra-ai-factory-platform-paves-way-for-age-of-ai-reasoning
[24] Fully-managed RAG стал стандартом: https://blog.google/technology/developers/file-search-gemini-api/
[25] логику: http://www.braintools.ru/article/7640
[26] Индустрия выстраивает provenance-слой: https://openai.com/index/openai-anthropic-safety-evaluation/
[27] Источник: https://habr.com/ru/companies/tochka/news/981552/?utm_source=habrahabr&utm_medium=rss&utm_campaign=981552
Нажмите здесь для печати.