- BrainTools - https://www.braintools.ru -
Google тестирует новый экспериментальный режим для Gemini 2.5 Pro, который расширяет возможности анализа и обеспечивает вывод звука. Новый режим под названием «Deep Think» призван помочь модели оценить несколько гипотез, прежде чем отвечать на запрос. По словам Google, он основан на новых методах исследования и в настоящее время тестируется на ограниченной группе пользователей Gemini API.

Google сообщает, что Gemini 2.5 Pro [1] с Deep Think превосходит модель o3 от OpenAI в нескольких задачах, включая математический тест USAMO 2025, тест на программирование LiveCodeBench и MMMU — тест на мультимодальное мышление [2].
Google также обновил свою модель 2.5 Flash [4], которая оптимизирована для повышения скорости и эффективности. Последняя версия лучше справляется с логическими, мультимодальными задачами и генерацией кода, при этом используя на 20–30% меньше токенов для получения того же результата.
Gemini 2.5 Flash теперь доступен в Google AI Studio [5], Vertex AI [6] и приложении Gemini [7]. Ожидается, что он станет доступен для производственного использования в начале июня.
И Gemini 2.5 Pro, и Flash теперь поддерживают преобразование текста в речь с использованием нескольких профилей динамиков. Голосовой вывод может воспроизводить такие тонкие эффекты, как шёпот и эмоциональный тон, и поддерживает более 24 языков. Разработчики могут управлять акцентом, тоном и стилем речи с помощью Live API.
Две новые функции — «Affective Dialogue» и «Proactive Audio» — призваны сделать голосовое взаимодействие более естественным. Affective Dialogue позволяет модели распознавать эмоции [8] в голосе пользователя и реагировать [9] соответствующим образом — нейтрально, сочувственно или весело. Proactive Audio помогает отфильтровывать фоновые разговоры, поэтому ИИ реагирует только на прямые обращения. Цель состоит в том, чтобы сократить количество случайных взаимодействий и сделать голосовое управление более надёжным.
Google также внедряет функции из Project Mariner [10] в Gemini API и Vertex AI, что позволяет модели управлять компьютерными приложениями, такими как веб-браузер.
Для разработчиков в Gemini теперь доступны «сводки мыслей» — структурированное представление о внутренних рассуждениях модели и выполняемых ею действиях. Для управления производительностью разработчики могут настроить «бюджеты мышления», чтобы ограничить или отключить количество токенов, используемых моделью для рассуждений.
API Gemini также теперь поддерживает Anthropic [11] Model Context Protocol (MCP) [12], который может упростить интеграцию с инструментами с открытым исходным кодом. Google изучает размещенные MCP-серверы для поддержки разработки приложений на основе агентов.
Компания Google добавила в свою линейку ИИ новую модель Gemma 3n [13] — легковесную модель с открытым исходным кодом, созданную специально для мобильных устройств, таких как смартфоны, планшеты и ноутбуки. Модель основана на новой архитектуре, разработанной в сотрудничестве с партнерами по производству оборудования, включая Qualcomm, MediaTek и Samsung.
Gemma 3n предназначена для обеспечения мощных мультимодальных возможностей при низком потреблении ресурсов. Версии с параметрами 5B и 8B требуют всего от 2 до 3 ГБ оперативной памяти [14], что делает их подходящими для использования на устройствах.
Модель поддерживает обработку текста, аудио и изображений и может выполнять такие задачи, как транскрипция, перевод и обработка смешанных входных данных в различных модальностях. Ключевой особенностью является функция «Mix-n-Match», которая позволяет разработчикам извлекать из основной архитектуры более мелкие подмодели в зависимости от сценария использования.
Google также улучшил многоязычные возможности Gemma 3n, особенно для таких языков, как немецкий, японский, корейский, испанский и французский. Предварительная версия модели теперь доступна через Google AI Studio [15] и AI Edge Toolkit [16] для локальной разработки.
Пользуясь случаем, хочу порекомендовать BotHub [17]— платформу, где можно протестировать все популярные модели без ограничений. Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке [18] вы можете получить 100 000 бесплатных токенов для первых задач и уже сейчас начать работать!
Источник [19]
Автор: mefdayy
Источник [20]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/15407
URLs in this post:
[1] Gemini 2.5 Pro: https://the-decoder.com/google-upgrades-gemini-2-5-pro-for-coding-and-app-development/
[2] мышление: http://www.braintools.ru/thinking
[3] математике: http://www.braintools.ru/article/7620
[4] обновил свою модель 2.5 Flash: https://the-decoder.com/googles-gemini-2-5-flash-gives-you-speed-when-you-need-it-and-reasoning-when-you-can-afford-it/
[5] Google AI Studio: https://makersuite.google.com/
[6] Vertex AI: https://cloud.google.com/vertex-ai
[7] приложении Gemini: https://blog.google/products/gemini/google-gemini-ai-app/
[8] эмоции: http://www.braintools.ru/article/9540
[9] реагировать: http://www.braintools.ru/article/1549
[10] Project Mariner: https://the-decoder.com/google-launches-gemini-2-0-focusing-on-ai-agents-and-multimodal-capabilities/
[11] Anthropic: https://www.anthropic.com/
[12] Model Context Protocol (MCP): https://docs.anthropic.com/claude/docs/model-context-protocol
[13] Gemma 3n: https://developers.googleblog.com/en/introducing-gemma-3n/
[14] памяти: http://www.braintools.ru/article/4140
[15] Google AI Studio: https://aistudio.google.com/app/prompts/new_chat?model=gemma-3n-e4b-it
[16] AI Edge Toolkit: https://developers.googleblog.com/en/google-ai-edge-small-language-models-multimodality-rag-function-calling
[17] BotHub : https://bothub.chat/?utm_source=contentmarketing&utm_medium=habr&utm_campaign=news&utm_content=GOOGLE_UPGRADES_GEMINI_2.5_PRO_WITH_A_NEW_DEEP_THINK_MODE_FOR_ADVANCED_REASONING_ABILITIES
[18] По ссылке: https://bothub.chat/?invitedBy=m_aGCkuyTgqllHCK0dUc7
[19] Источник: https://the-decoder.com/google-upgrades-gemini-2-5-pro-with-a-new-deep-think-mode-for-advanced-reasoning-abilities/
[20] Источник: https://habr.com/ru/companies/bothub/news/911296/?utm_source=habrahabr&utm_medium=rss&utm_campaign=911296
Нажмите здесь для печати.