- BrainTools - https://www.braintools.ru -

AI-итоги года: 25 событий 2025-го в 10 главных трендах

2025-й войдёт в историю как год, когда AI перестал «отвечать» и начал «делать». Модели научились рассуждать по бюджету, агенты захватили браузеры и терминалы, а видео и голос превратились из демок в часть инфраструктуры. Собрали 25 ключевых событий, разбитых по 10 главным трендам года.

AI-итоги года: 25 событий 2025-го в 10 главных трендах - 1

🤖 Тренд 1: Агенты, MCP и стандартизация действий

2025-й — год, когда чат окончательно превратился в исполнителя: модели планируют, вызывают инструменты, выполняют действия.

🧠 Тренд 2: Reasoning и «думать по бюджету»

Качество растёт не только за счёт размера, но и через умение рассуждать и управлять глубиной мышления [5].

💻 Тренд 3: Вайб-кодинг и разработка через агента

Если 2024 был про Copilot-подсказчик, то 2025 — про постановку задач агенту и контроль результата.

🎬 Тренд 4: Видео и голос стали частью инфраструктуры

Видео и голос перестали быть демками и превратились в инфраструктуру: API, цены, лимиты, прод-сценарии.

🎯 Тренд 5: Спец-модели и on-device

Параллельно с гонкой флагманов рынок полюбил узкие, дешёвые модели с понятной ценностью.

🇨🇳 Тренд 6: Китайский open-weights давит темпом

Китайские релизы 2025-го — это уже не «догнать», а давление темпом: много моделей, много открытости, инженерия эффективности.

  • Qwen 3 сделал thinking/non-thinking штатной функцией [18]: семейство dense+MoE, переключаемые режимы вывода, thinking budget как ручка управления стоимостью/качеством, расширенная многоязычность.

  • ERNIE 4.5 от Baidu вышел под Apache-лицензией [19]: пакет моделей включая крупные MoE, сильная мультимодальность, ориентация на deployment-стек — плюс Moonshot/Kimi тоже выкатили открытые веса, усиливая волну открытых релизов из Китая.

🇷🇺 Тренд 7: Россия — локальные флагманы и прикладной AI

Тренд года — не один «умный чат», а связка модель + сценарии + интеграции + цена.

⚡ Тренд 8: AI-фабрики и железо под эпоху инференса

На уровне железа 2025-й — это уже не только «тренируем», а «как масштабируем инференс для миллиардов запросов».

  • Blackwell Ultra + TPU Ironwood задали вектор на массовый инференс [23]: NVIDIA продвигает концепт AI Factory для генерации в промышленных масштабах, Google показывает TPU Ironwood как специализированный инференс-ускоритель — тема энергопотребления стала узким местом в публичных обсуждениях.

📚 Тренд 9: RAG и поиск как продукт

Если в 2023–24 RAG был приёмом, то в 2025 он стал отдельным продуктовым слоем.

  • Fully-managed RAG стал стандартом [24]: Google продвигает File Search Tool как managed-сервис — загрузка, индексация, поиск через API. OpenAI усиливает аналогичную логику [25] через File Search в Responses API — «агент с документами» собирается без ручной инженерии.

🔐 Тренд 10: Provenance и доверие к контенту

Когда синтетики много, нужны технические маркеры доверия и практики оценки рисков.

  • Индустрия выстраивает provenance-слой [26]: C2PA v2.2 обновляет спецификации происхождения медиа, Google раскатывает SynthID для детекта синтетики, OpenAI и Anthropic делают взаимные кросс-оценки безопасности моделей — редкий, но важный сигнал зрелости.

2025-й стал годом перехода от «модель отвечает» к «модель делает»: DeepSeek показал, что open-weight модели конкурируют по reasoning-качеству, MCP стал де-факто одним из главных протоколов интеграций, vibe coding изменил культуру разработки, а агенты захватили браузеры, терминалы и IDE. Железо догоняет софт — Blackwell и Ironwood задают вектор на массовый инференс. 

Какой тренд 2025 года оказался для вас самым неожиданным? Делитесь в комментариях!

Автор: tochka_team

Источник [27]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/23849

URLs in this post:

[1] OpenAI превратила Responses API в единый control plane для агентов: https://openai.com/index/new-tools-and-features-in-the-responses-api

[2] ChatGPT Agent получил доступ к браузеру, терминалу и «своему компьютеру»: https://openai.com/index/introducing-chatgpt-agent

[3] Anthropic запустила Claude Integrations с упором на длинные задачи: https://www.anthropic.com/news/integrations

[4] Google представила A2A — протокол для общения агентов разных производителей: https://www.microsoft.com/en-us/microsoft-cloud/blog/2025/05/07/empowering-multi-agent-apps-with-the-open-agent2agent-a2a-protocol

[5] мышления: http://www.braintools.ru/thinking

[6] OpenAI упростила модельный выбор: https://openai.com/index/introducing-gpt-5/

[7] Gemini 2.5 Pro/Flash получили контекст до 1M токенов и регулятор размышлений: https://developers.googleblog.com/en/gemini-2-5-flash-pro-live-api-veo-2-gemini-api%5D

[8] DeepSeek-R1 стал новой базой сравнения для открытых моделей: https://techcrunch.com/2025/05/28/deepseek-updates-its-r1-reasoning-ai-model-releases-it-on-hugging-face/

[9] Vibe coding стал термином года: https://venturebeat.com/ai/googles-new-vibe-coding-ai-studio-experience-lets-anyone-build-deploy-apps/

[10] OpenAI Codex превратился в код-агента с песочницей: https://openai.com/index/introducing-codex

[11] Cursor 2.0 сделал IDE оркестратором нескольких агентов: https://cursor.com/blog/2-0

[12] Qwen3-Coder бросил вызов закрытым IDE-агентам: https://qwenlm.github.io/blog/qwen3-coder/

[13] Sora 2 стала платформой, а не просто генератором роликов: https://openai.com/index/sora-2/

[14] Veo 2 появилась в Gemini API с понятной экономикой: https://developers.googleblog.com/en/gemini-2-5-flash-pro-live-api-veo-2-gemini-api

[15] gpt-realtime вышел в GA с SIP и MCP: https://openai.com/index/introducing-gpt-realtime/

[16] Mistral OCR сделал документы отдельным классом задач: https://mistral.ai/news/mistral-ocr-3

[17] Microsoft Mu показала, зачем нужны специализированные малые модели: https://blogs.windows.com/windowsexperience/2025/06/23/introducing-mu-language-model-and-how-it-enabled-the-agent-in-windows-settings/

[18] Qwen 3 сделал thinking/non-thinking штатной функцией: https://github.com/QwenLM/Qwen3/blob/main/Qwen3_Technical_Report.pdf

[19] ERNIE 4.5 от Baidu вышел под Apache-лицензией: https://ernie.baidu.com/blog/posts/ernie4.5/

[20] YandexGPT 5.1 Pro нацелился на корпоративные сценарии: https://yandex.ru/company/news/28-08-2025-01

[21] GigaChat 2.0 вырос до «200 страниц» контекста: https://www.sberbank.com/ru/news-and-media/press-releases/article?newsID=50dce36e-befd-431d-9633-6e19ed7a1a76&blockID=7&regionID=34&lang=ru&type=NEWS

[22] Sber выложил open-компоненты: https://habr.com/ru/news/952096/

[23] Blackwell Ultra + TPU Ironwood задали вектор на массовый инференс: https://nvidianews.nvidia.com/news/nvidia-blackwell-ultra-ai-factory-platform-paves-way-for-age-of-ai-reasoning

[24] Fully-managed RAG стал стандартом: https://blog.google/technology/developers/file-search-gemini-api/

[25] логику: http://www.braintools.ru/article/7640

[26] Индустрия выстраивает provenance-слой: https://openai.com/index/openai-anthropic-safety-evaluation/

[27] Источник: https://habr.com/ru/companies/tochka/news/981552/?utm_source=habrahabr&utm_medium=rss&utm_campaign=981552

www.BrainTools.ru

Rambler's Top100