У Gemini появилось агентное зрение. ai.. ai. gemini ai.. ai. gemini ai. google.. ai. gemini ai. google. Блог компании BotHub.. ai. gemini ai. google. Блог компании BotHub. Будущее здесь.. ai. gemini ai. google. Блог компании BotHub. Будущее здесь. ИИ.. ai. gemini ai. google. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект.. ai. gemini ai. google. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение.. ai. gemini ai. google. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение. машинное+обучение.. ai. gemini ai. google. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение. машинное+обучение. научно-популярное.. ai. gemini ai. google. Блог компании BotHub. Будущее здесь. ИИ. искусственный интеллект. Машинное обучение. машинное+обучение. научно-популярное. нейросети.
У Gemini появилось агентное зрение - 1

Google фактически изменил сам принцип работы Gemini с изображениями. Если раньше модель просто анализировала картинку целиком и отвечала на основе общего восприятия, то теперь она действует как исследователь. Gemini использует цикл «думай, действуй, наблюдай» и сама решает, какие операции нужно выполнить, чтобы лучше понять сцену.

На практике это выглядит так. Если на изображении есть мелкие детали, модель не гадает, а генерирует и исполняет код для увеличения фрагмента, обрезки нужной области или разметки объектов. При подсчете предметов Gemini сначала выделяет их рамками, нумерует и только потом считает. Это резко снижает количество ошибок, которые раньше возникали из за визуальных галлюцинаций.

У Gemini появилось агентное зрение - 2

Отдельно прокачали работу с таблицами и графиками. Вместо интерпретации «на глаз» модель теперь извлекает данные и проводит реальные вычисления через код. В результате ответы стали более строгими и проверяемыми, что особенно важно для аналитики, обучения и работы с отчетами.

По данным Google, качество ответов в визуальных задачах выросло на 5–10 процентов. Обновление уже доступно в AI Studio, Vertex AI и в приложении Gemini в режиме Thinking. Фактически это приближает модель к полноценному визуальному агенту, который не просто смотрит на картинку, а активно с ней работает.


Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейча��!

Источник

Автор: cognitronn

Источник

Rambler's Top100