Google представила Gemini Omni — универсальную ИИ-модель. Роботы работают, счастлив человек

Искусственный интеллект ^[1] уже давно вышел за рамки простых ответов на вопросы и теперь все чаще берется за полноценные рабочие процессы, где нужно не только сообразить, но и сделать. Компании постепенно учат свои системы самостоятельно разбираться с длинными цепочками операций, взаимодействовать с сервисами и доводить дело до конца без постоянного присмотра. Google на конференции I/O 2026 показала ^[2], насколько далеко зашел этот процесс, представив сразу две новые модели из семейства Gemini — 3.5 Flash и Omni, которые, по сути, закладывают основу следующего большого шага в развитии ИИ.

Анонс привлек внимание ^[3] не из-за очередного роста скорости или размеров моделей. Google показала ИИ, который умеет не только генерировать контент, но и самостоятельно выполнять задачи, работать с сервисами и обрабатывать сразу несколько типов данных — текст, видео, изображения и звук. Разберемся, что умеют новые Gemini и почему Google делает ставку именно на такой подход.

Gemini 3.5 Flash — быстрая основа для действий

Новая версия Flash сразу выделяется тем, как ловко она сочетает высокую скорость генерации с уровнем интеллекта, который раньше встречался только в более тяжелых и дорогих моделях. Она выдает около 300 токенов в секунду (это примерно в четыре раза быстрее предыдущего поколения) и при этом не теряет в качестве ответов. Такая производительность особенно заметна там, где нужно провести длинную последовательность операций: от написания кода до полной итерации проекта с правками и тестированием. Разработчики, которые уже попробовали модель, отмечают, что она уверенно справляется с задачами, где важно не просто выдать фрагмент, а довести его до рабочего состояния без лишних задержек.

Загвоздка в предыдущих версиях часто была в том, что высокая скорость обычно приходила в ущерб точности на сложных сценариях. Здесь Google, похоже, удалось это обойти благодаря серьезной доработке пост-тренинга. В дело пошли реальные данные от пользователей Antigravity IDE, и теперь система может параллельно обрабатывать несколько подзадач, смотреть на промежуточные результаты и корректировать курс на лету. В независимых тестах Flash показывает заметный прогресс по сравнению с Gemini 3.1 Pro, особенно в бенчмарках, связанных с управлением интерфейсами и операционными системами. На Terminal Bench и SWE-Bench Pro она идет вровень с лучшими конкурентами, а кое-где даже обгоняет их.

На практике это открывает довольно удобные возможности для автономной работы с сервисами и приложениями. Модель спокойно разбирает большие объемы неструктурированных файлов, сортирует их по заданным правилам, переименовывает и собирает отчеты — все в рамках одного долгого сеанса. Экономия на токенах при этом получается существенная, поэтому компании, которые активно используют ИИ, могут серьезно снизить затраты. При этом Flash остается вполне доступной: она уже работает через API, в студии разработки и в мобильных приложениях, так что переход на нее не требует перестраивать весь процесс с нуля.

Интеграция с существующими продуктами Google тоже сделана с умом. В Antigravity 2.0, например, она позволяет запускать целые рабочие потоки, где несколько агентов общаются между собой и делят подзадачи. Это уже вполне рабочий инструмент для автоматизации рутины в разработке и повседневных делах.

Gemini Omni — шаг к универсальной мультимодальности

Omni Flash пошла дальше и попыталась собрать в одну систему работу с текстом, изображениями, звуком и видео. На старте акцент сделали на генерации и редактировании роликов, где она пришла на смену предыдущим специализированным инструментам вроде Veo. Модель принимает на вход любую комбинацию данных и выдает новый материал, который учитывает физические законы, освещение и поведение ^[5] объектов. Результаты получаются довольно естественными — без резких скачков и несоответствий, которые раньше часто портили впечатление ^[6].

Вот только раньше для каждого типа контента приходилось использовать отдельный инструмент, и это создавало массу неудобств. Здесь же все происходит в одном разговорном режиме: пользователь описывает изменения шаг за шагом, а система последовательно их применяет, сохраняя согласованность на протяжении нескольких итераций. Можно взять обычное домашнее видео, добавить в него персонажа, поменять ракурс или подкрутить динамику — и не нужно заново генерировать ролик с самого начала. Такой подход особенно удобен тем, кто делает контент для YouTube Shorts или Google Flow, где скорость и естественность решают все.

Пока полная версия, которая будет одинаково глубоко работать со всеми форматами, еще в разработке, но уже текущая реализация заметно упрощает жизнь. Не приходится переключаться между разными сервисами и ломать голову над совместимостью.

Почему Google делает ставку на агентный ИИ

Компания сместила акценты с обычных генеративных моделей в сторону систем, которые способны самостоятельно выполнять действия от начала до конца. Агент здесь — сочетание интеллекта с дополнительной обвязкой, которая позволяет взаимодействовать с внешними сервисами, планировать шаги и доводить задачу до логического завершения. Такой подход решает главную слабость классических чат-ботов: они отлично отвечают на отдельные вопросы, но редко берут на себя ответственность за длинный процесс.

Справедливости ради надо сказать, что обычные помощники до сих пор прекрасно справляются с быстрыми запросами. Однако когда дело доходит до долгосрочных целей, они быстро пасуют. Агентные системы, наоборот, разбивают задачу на этапы, используют внешние инструменты и корректируют план по ходу дела. Google видит в этом реальный путь сделать искусственный интеллект массово полезным. Эффективность Flash позволяет запускать такие системы без запредельных затрат, а мультимодальность Omni добавляет им гибкости при работе с реальным контентом.

Архитектура платформ тоже меняется в соответствии с новой стратегией. Вместо набора узкоспециализированных решений компания движется к унифицированным движкам, где один механизм отвечает за разные типы задач. Это заметно снижает накладные расходы и упрощает интеграцию. Antigravity и Enterprise Agent Platform — яркие примеры такой эволюции: они дают готовую среду для оркестрации агентов, мониторинга и масштабирования.

В итоге платформы становятся похожими на операционные системы, где модели выступают уже не советчиками, а активными исполнителями. Пользователи получают цельную экосистему, которая способна адаптироваться под сложные сценарии. Удивительно, но именно в этом Google видит будущее широкого внедрения ИИ в повседневную работу.

Доступность, практическое применение и что дальше

Gemini 3.5 Flash уже доступна в приложении Gemini, через API и в инструментах для разработчиков, включая Antigravity и Android Studio. Ценообразование сделали довольно привлекательным для больших объемов, так что компании могут внедрять модель без серьезных финансовых потрясений. Omni Flash интегрирована в сервисы для создания контента и постепенно расширяет свои возможности на другие форматы.

Gemini Spark, который работает как автономный агент в облаке, пока доступен только в подписке Ultra, но компания уже озвучила планы сделать его шире. Он может круглосуточно следить за почтой, документами и календарем, готовить сводки и даже задавать уточняющие вопросы перед важными шагами. При этом безопасность остается на первом месте — серьезные действия всегда требуют явного подтверждения от пользователя.

В перспективе ждем появления Pro-версий обеих моделей и дальнейшего слияния их возможностей. Разработчики смогут собирать собственных агентов с минимальными усилиями, а обычные пользователи — решать рутинные задачи быстрее и качественнее. Словом, вся эта эволюция ^[7] направлена не на технологические рекорды ради рекордов, а на реальную помощь в работе и творчестве ^[8].

Изменения, которые принесли новые Gemini, выглядят вполне логичным продолжением того пути, по которому индустрия шла последние годы. Они заметно поднимают планку ожиданий от искусственного интеллекта.

А пользуетесь ли вы уже агентными возможностями ИИ в своей работе? Расскажите в комментариях.

Автор: t3chnowolf

Источник ^[9]

Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/30656

URLs in this post:

[1] интеллект: http://www.braintools.ru/article/7605

[2] показала: https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/

[3] внимание: http://www.braintools.ru/article/7595

[4] Источник: https://arstechnica.com/google/2026/05/google-announces-agent-optimized-gemini-3-5-flash-and-a-do-anything-model-called-omni/

[5] поведение: http://www.braintools.ru/article/9372

[6] впечатление: http://www.braintools.ru/article/2012

[7] эволюция: http://www.braintools.ru/article/7702

[8] творчестве: http://www.braintools.ru/creation

[9] Источник: https://habr.com/ru/companies/ru_mts/articles/1038276/?utm_source=habrahabr&utm_medium=rss&utm_campaign=1038276

Нажмите здесь для печати.