AI-итоги года: 25 событий 2025-го в 10 главных трендах

2025-й войдёт в историю как год, когда AI перестал «отвечать» и начал «делать». Модели научились рассуждать по бюджету, агенты захватили браузеры и терминалы, а видео и голос превратились из демок в часть инфраструктуры. Собрали 25 ключевых событий, разбитых по 10 главным трендам года.

🤖 Тренд 1: Агенты, MCP и стандартизация действий

2025-й — год, когда чат окончательно превратился в исполнителя: модели планируют, вызывают инструменты, выполняют действия.

OpenAI превратила Responses API в единый control plane для агентов ^[1]: MCP-серверы, tool-use прямо в reasoning, File Search, Code Interpreter, генерация изображений и background mode для долгих задач — всё в одном интерфейсе.
ChatGPT Agent получил доступ к браузеру, терминалу и «своему компьютеру» ^[2]: агентный режим теперь не демка, а продукт — доступен Plus/Pro/Team с региональными ограничениями.
Anthropic запустила Claude Integrations с упором на длинные задачи ^[3]: коннекторы как продукт, MCP-плагины для сервисов, усиление «исследовательских» сценариев со сбором контекста из разных источников.
Google представила A2A — протокол для общения агентов разных производителей ^[4]: Agent2Agent как попытка создать общий язык межагентного взаимодействия, Microsoft заявила поддержку.

🧠 Тренд 2: Reasoning и «думать по бюджету»

Качество растёт не только за счёт размера, но и через умение рассуждать и управлять глубиной мышления ^[5].

OpenAI упростила модельный выбор ^[6]: GPT-5 стал основным флагманом с быстрым и «глубоким» режимами и авто-роутингом задач — упор на код, мультимодальность и следование инструкциям.
Reasoning-модели научились вызывать инструменты в ходе решения задачи ^[1]: в Responses API o-линейка (o3, o4-mini) получила tool calling внутри агентного цикла, а не «после ответа».
Gemini 2.5 Pro/Flash получили контекст до 1M токенов и регулятор размышлений ^[7]: thinking budget как ручка управления — когда надо быстро, модель думает быстро, когда надо глубоко — глубоко.
DeepSeek-R1 стал новой базой сравнения для открытых моделей ^[8]: китайская open-weight reasoning-модель доказала, что reasoning масштабируется не только размером, но и пост-тренингом.

💻 Тренд 3: Вайб-кодинг и разработка через агента

Если 2024 был про Copilot-подсказчик, то 2025 — про постановку задач агенту и контроль результата.

Vibe coding стал термином года ^[9]: формула «я задаю намерение → агент пишет/правит → я проверяю» стала массовой практикой.
OpenAI Codex превратился в код-агента с песочницей ^[10]: изолированная среда, параллельные задачи, упор на сквозную работу с репозиторием — от автодополнения к исполнителю.
Cursor 2.0 сделал IDE оркестратором нескольких агентов ^[11]: до 8 агентов параллельно, разные модели, изолированные окружения через git worktrees, контроль диффов и безопасный терминал.
Qwen3-Coder бросил вызов закрытым IDE-агентам ^[12]: open-weight код-агент с agentic coding, tool use, browser use — контекст до 1M токенов, MoE-архитектура.

🎬 Тренд 4: Видео и голос стали частью инфраструктуры

Видео и голос перестали быть демками и превратились в инфраструктуру: API, цены, лимиты, прод-сценарии.

Sora 2 стала платформой, а не просто генератором роликов ^[13]: продуктовый формат с cameos, сценариями и выходом к API через партнёрские интеграции.
Veo 2 появилась в Gemini API с понятной экономикой ^[14]: 8 секунд, 720p, цена за секунду — видео-генерация как прод-сервис в dev-экосистеме Google.
gpt-realtime вышел в GA с SIP и MCP ^[15]: speech-to-speech в одной модели, низкие задержки, удалённые MCP-серверы, изображения на входе, точный function calling — голосовые агенты стали реальностью.

🎯 Тренд 5: Спец-модели и on-device

Параллельно с гонкой флагманов рынок полюбил узкие, дешёвые модели с понятной ценностью.

Mistral OCR сделал документы отдельным классом задач ^[16]: OCR для рукописей, форм и таблиц с прозрачной экономикой — $2 за 1 000 страниц ($1 в Batch-режиме).
Microsoft Mu показала, зачем нужны специализированные малые модели ^[17]: 330M параметров, работа на NPU, быстрые ответы без облака — «внутренний агент» Windows для помощи с настройками.

🇨🇳 Тренд 6: Китайский open-weights давит темпом

Китайские релизы 2025-го — это уже не «догнать», а давление темпом: много моделей, много открытости, инженерия эффективности.

Qwen 3 сделал thinking/non-thinking штатной функцией ^[18]: семейство dense+MoE, переключаемые режимы вывода, thinking budget как ручка управления стоимостью/качеством, расширенная многоязычность.
ERNIE 4.5 от Baidu вышел под Apache-лицензией ^[19]: пакет моделей включая крупные MoE, сильная мультимодальность, ориентация на deployment-стек — плюс Moonshot/Kimi тоже выкатили открытые веса, усиливая волну открытых релизов из Китая.

🇷🇺 Тренд 7: Россия — локальные флагманы и прикладной AI

Тренд года — не один «умный чат», а связка модель + сценарии + интеграции + цена.

YandexGPT 5.1 Pro нацелился на корпоративные сценарии ^[20]: RAG, работа с документами и отчётами, меньше галлюцинаций — упор на контролируемость и понятную экономику.
GigaChat 2.0 вырос до «200 страниц» контекста ^[21]: в 4 раза больше контекста, лучшее следование инструкциям, опции облачного и локального развёртывания.
Sber выложил open-компоненты ^[22]: Giga-Embeddings для RAG и Kandinsky Video Lite для генерации видео.

⚡ Тренд 8: AI-фабрики и железо под эпоху инференса

На уровне железа 2025-й — это уже не только «тренируем», а «как масштабируем инференс для миллиардов запросов».

Blackwell Ultra + TPU Ironwood задали вектор на массовый инференс ^[23]: NVIDIA продвигает концепт AI Factory для генерации в промышленных масштабах, Google показывает TPU Ironwood как специализированный инференс-ускоритель — тема энергопотребления стала узким местом в публичных обсуждениях.

📚 Тренд 9: RAG и поиск как продукт

Если в 2023–24 RAG был приёмом, то в 2025 он стал отдельным продуктовым слоем.

Fully-managed RAG стал стандартом ^[24]: Google продвигает File Search Tool как managed-сервис — загрузка, индексация, поиск через API. OpenAI усиливает аналогичную логику ^[25] через File Search в Responses API — «агент с документами» собирается без ручной инженерии.

🔐 Тренд 10: Provenance и доверие к контенту

Когда синтетики много, нужны технические маркеры доверия и практики оценки рисков.

Индустрия выстраивает provenance-слой ^[26]: C2PA v2.2 обновляет спецификации происхождения медиа, Google раскатывает SynthID для детекта синтетики, OpenAI и Anthropic делают взаимные кросс-оценки безопасности моделей — редкий, но важный сигнал зрелости.

2025-й стал годом перехода от «модель отвечает» к «модель делает»: DeepSeek показал, что open-weight модели конкурируют по reasoning-качеству, MCP стал де-факто одним из главных протоколов интеграций, vibe coding изменил культуру разработки, а агенты захватили браузеры, терминалы и IDE. Железо догоняет софт — Blackwell и Ironwood задают вектор на массовый инференс.

Какой тренд 2025 года оказался для вас самым неожиданным? Делитесь в комментариях!

Автор: tochka_team

Источник ^[27]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/23849

URLs in this post:

[1] OpenAI превратила Responses API в единый control plane для агентов: https://openai.com/index/new-tools-and-features-in-the-responses-api

[2] ChatGPT Agent получил доступ к браузеру, терминалу и «своему компьютеру»: https://openai.com/index/introducing-chatgpt-agent

[3] Anthropic запустила Claude Integrations с упором на длинные задачи: https://www.anthropic.com/news/integrations

[4] Google представила A2A — протокол для общения агентов разных производителей: https://www.microsoft.com/en-us/microsoft-cloud/blog/2025/05/07/empowering-multi-agent-apps-with-the-open-agent2agent-a2a-protocol

[5] мышления: http://www.braintools.ru/thinking

[6] OpenAI упростила модельный выбор: https://openai.com/index/introducing-gpt-5/

[7] Gemini 2.5 Pro/Flash получили контекст до 1M токенов и регулятор размышлений: https://developers.googleblog.com/en/gemini-2-5-flash-pro-live-api-veo-2-gemini-api%5D

[8] DeepSeek-R1 стал новой базой сравнения для открытых моделей: https://techcrunch.com/2025/05/28/deepseek-updates-its-r1-reasoning-ai-model-releases-it-on-hugging-face/

[9] Vibe coding стал термином года: https://venturebeat.com/ai/googles-new-vibe-coding-ai-studio-experience-lets-anyone-build-deploy-apps/

[10] OpenAI Codex превратился в код-агента с песочницей: https://openai.com/index/introducing-codex

[11] Cursor 2.0 сделал IDE оркестратором нескольких агентов: https://cursor.com/blog/2-0

[12] Qwen3-Coder бросил вызов закрытым IDE-агентам: https://qwenlm.github.io/blog/qwen3-coder/

[13] Sora 2 стала платформой, а не просто генератором роликов: https://openai.com/index/sora-2/

[14] Veo 2 появилась в Gemini API с понятной экономикой: https://developers.googleblog.com/en/gemini-2-5-flash-pro-live-api-veo-2-gemini-api

[15] gpt-realtime вышел в GA с SIP и MCP: https://openai.com/index/introducing-gpt-realtime/

[16] Mistral OCR сделал документы отдельным классом задач: https://mistral.ai/news/mistral-ocr-3

[17] Microsoft Mu показала, зачем нужны специализированные малые модели: https://blogs.windows.com/windowsexperience/2025/06/23/introducing-mu-language-model-and-how-it-enabled-the-agent-in-windows-settings/

[18] Qwen 3 сделал thinking/non-thinking штатной функцией: https://github.com/QwenLM/Qwen3/blob/main/Qwen3_Technical_Report.pdf

[19] ERNIE 4.5 от Baidu вышел под Apache-лицензией: https://ernie.baidu.com/blog/posts/ernie4.5/

[20] YandexGPT 5.1 Pro нацелился на корпоративные сценарии: https://yandex.ru/company/news/28-08-2025-01

[21] GigaChat 2.0 вырос до «200 страниц» контекста: https://www.sberbank.com/ru/news-and-media/press-releases/article?newsID=50dce36e-befd-431d-9633-6e19ed7a1a76&blockID=7&regionID=34&lang=ru&type=NEWS

[22] Sber выложил open-компоненты: https://habr.com/ru/news/952096/

[23] Blackwell Ultra + TPU Ironwood задали вектор на массовый инференс: https://nvidianews.nvidia.com/news/nvidia-blackwell-ultra-ai-factory-platform-paves-way-for-age-of-ai-reasoning

[24] Fully-managed RAG стал стандартом: https://blog.google/technology/developers/file-search-gemini-api/

[25] логику: http://www.braintools.ru/article/7640

[26] Индустрия выстраивает provenance-слой: https://openai.com/index/openai-anthropic-safety-evaluation/

[27] Источник: https://habr.com/ru/companies/tochka/news/981552/?utm_source=habrahabr&utm_medium=rss&utm_campaign=981552

Нажмите здесь для печати.