Google представила Gemini Omni — универсальную ИИ-модель. Роботы работают, счастлив человек. gemini.. gemini. google.. gemini. google. IT-компании.. gemini. google. IT-компании. Блог компании МТС.. gemini. google. IT-компании. Блог компании МТС. ИИ.. gemini. google. IT-компании. Блог компании МТС. ИИ. искусственный интеллект.. gemini. google. IT-компании. Блог компании МТС. ИИ. искусственный интеллект. Машинное обучение.
Google представила Gemini Omni — универсальную ИИ-модель. Роботы работают, счастлив человек - 1

Искусственный интеллект уже давно вышел за рамки простых ответов на вопросы и теперь все чаще берется за полноценные рабочие процессы, где нужно не только сообразить, но и сделать. Компании постепенно учат свои системы самостоятельно разбираться с длинными цепочками операций, взаимодействовать с сервисами и доводить дело до конца без постоянного присмотра. Google на конференции I/O 2026 показала, насколько далеко зашел этот процесс, представив сразу две новые модели из семейства Gemini — 3.5 Flash и Omni, которые, по сути, закладывают основу следующего большого шага в развитии ИИ.

Анонс привлек внимание не из-за очередного роста скорости или размеров моделей. Google показала ИИ, который умеет не только генерировать контент, но и самостоятельно выполнять задачи, работать с сервисами и обрабатывать сразу несколько типов данных — текст, видео, изображения и звук. Разберемся, что умеют новые Gemini и почему Google делает ставку именно на такой подход. 

Gemini 3.5 Flash — быстрая основа для действий

Новая версия Flash сразу выделяется тем, как ловко она сочетает высокую скорость генерации с уровнем интеллекта, который раньше встречался только в более тяжелых и дорогих моделях. Она выдает около 300 токенов в секунду (это примерно в четыре раза быстрее предыдущего поколения) и при этом не теряет в качестве ответов. Такая производительность особенно заметна там, где нужно провести длинную последовательность операций: от написания кода до полной итерации проекта с правками и тестированием. Разработчики, которые уже попробовали модель, отмечают, что она уверенно справляется с задачами, где важно не просто выдать фрагмент, а довести его до рабочего состояния без лишних задержек.

Источник

Загвоздка в предыдущих версиях часто была в том, что высокая скорость обычно приходила в ущерб точности на сложных сценариях. Здесь Google, похоже, удалось это обойти благодаря серьезной доработке пост-тренинга. В дело пошли реальные данные от пользователей Antigravity IDE, и теперь система может параллельно обрабатывать несколько подзадач, смотреть на промежуточные результаты и корректировать курс на лету. В независимых тестах Flash показывает заметный прогресс по сравнению с Gemini 3.1 Pro, особенно в бенчмарках, связанных с управлением интерфейсами и операционными системами. На Terminal Bench и SWE-Bench Pro она идет вровень с лучшими конкурентами, а кое-где даже обгоняет их.

На практике это открывает довольно удобные возможности для автономной работы с сервисами и приложениями. Модель спокойно разбирает большие объемы неструктурированных файлов, сортирует их по заданным правилам, переименовывает и собирает отчеты — все в рамках одного долгого сеанса. Экономия на токенах при этом получается существенная, поэтому компании, которые активно используют ИИ, могут серьезно снизить затраты. При этом Flash остается вполне доступной: она уже работает через API, в студии разработки и в мобильных приложениях, так что переход на нее не требует перестраивать весь процесс с нуля.

Интеграция с существующими продуктами Google тоже сделана с умом. В Antigravity 2.0, например, она позволяет запускать целые рабочие потоки, где несколько агентов общаются между собой и делят подзадачи. Это уже вполне рабочий инструмент для автоматизации рутины в разработке и повседневных делах.

Gemini Omni — шаг к универсальной мультимодальности

Omni Flash пошла дальше и попыталась собрать в одну систему работу с текстом, изображениями, звуком и видео. На старте акцент сделали на генерации и редактировании роликов, где она пришла на смену предыдущим специализированным инструментам вроде Veo. Модель принимает на вход любую комбинацию данных и выдает новый материал, который учитывает физические законы, освещение и поведение объектов. Результаты получаются довольно естественными — без резких скачков и несоответствий, которые раньше часто портили впечатление.

Источник

Вот только раньше для каждого типа контента приходилось использовать отдельный инструмент, и это создавало массу неудобств. Здесь же все происходит в одном разговорном режиме: пользователь описывает изменения шаг за шагом, а система последовательно их применяет, сохраняя согласованность на протяжении нескольких итераций. Можно взять обычное домашнее видео, добавить в него персонажа, поменять ракурс или подкрутить динамику — и не нужно заново генерировать ролик с самого начала. Такой подход особенно удобен тем, кто делает контент для YouTube Shorts или Google Flow, где скорость и естественность решают все.

Пока полная версия, которая будет одинаково глубоко работать со всеми форматами, еще в разработке, но уже текущая реализация заметно упрощает жизнь. Не приходится переключаться между разными сервисами и ломать голову над совместимостью. 

Почему Google делает ставку на агентный ИИ

Компания сместила акценты с обычных генеративных моделей в сторону систем, которые способны самостоятельно выполнять действия от начала до конца. Агент здесь — сочетание интеллекта с дополнительной обвязкой, которая позволяет взаимодействовать с внешними сервисами, планировать шаги и доводить задачу до логического завершения. Такой подход решает главную слабость классических чат-ботов: они отлично отвечают на отдельные вопросы, но редко берут на себя ответственность за длинный процесс.

Справедливости ради надо сказать, что обычные помощники до сих пор прекрасно справляются с быстрыми запросами. Однако когда дело доходит до долгосрочных целей, они быстро пасуют. Агентные системы, наоборот, разбивают задачу на этапы, используют внешние инструменты и корректируют план по ходу дела. Google видит в этом реальный путь сделать искусственный интеллект массово полезным. Эффективность Flash позволяет запускать такие системы без запредельных затрат, а мультимодальность Omni добавляет им гибкости при работе с реальным контентом.

Источник

Архитектура платформ тоже меняется в соответствии с новой стратегией. Вместо набора узкоспециализированных решений компания движется к унифицированным движкам, где один механизм отвечает за разные типы задач. Это заметно снижает накладные расходы и упрощает интеграцию. Antigravity и Enterprise Agent Platform — яркие примеры такой эволюции: они дают готовую среду для оркестрации агентов, мониторинга и масштабирования.

В итоге платформы становятся похожими на операционные системы, где модели выступают уже не советчиками, а активными исполнителями. Пользователи получают цельную экосистему, которая способна адаптироваться под сложные сценарии. Удивительно, но именно в этом Google видит будущее широкого внедрения ИИ в повседневную работу.

Доступность, практическое применение и что дальше

Gemini 3.5 Flash уже доступна в приложении Gemini, через API и в инструментах для разработчиков, включая Antigravity и Android Studio. Ценообразование сделали довольно привлекательным для больших объемов, так что компании могут внедрять модель без серьезных финансовых потрясений. Omni Flash интегрирована в сервисы для создания контента и постепенно расширяет свои возможности на другие форматы.

Gemini Spark, который работает как автономный агент в облаке, пока доступен только в подписке Ultra, но компания уже озвучила планы сделать его шире. Он может круглосуточно следить за почтой, документами и календарем, готовить сводки и даже задавать уточняющие вопросы перед важными шагами. При этом безопасность остается на первом месте — серьезные действия всегда требуют явного подтверждения от пользователя.

В перспективе ждем появления Pro-версий обеих моделей и дальнейшего слияния их возможностей. Разработчики смогут собирать собственных агентов с минимальными усилиями, а обычные пользователи — решать рутинные задачи быстрее и качественнее. Словом, вся эта эволюция направлена не на технологические рекорды ради рекордов, а на реальную помощь в работе и творчестве.

Изменения, которые принесли новые Gemini, выглядят вполне логичным продолжением того пути, по которому индустрия шла последние годы. Они заметно поднимают планку ожиданий от искусственного интеллекта. 

А пользуетесь ли вы уже агентными возможностями ИИ в своей работе? Расскажите в комментариях.

Автор: t3chnowolf

Источник