- BrainTools - https://www.braintools.ru -
В четверг компания Google объявила [1], что внедряет новые функции искусственного интеллекта [2] и специальных возможностей в Android и Chrome. В частности, TalkBack, программа для чтения с экрана в Android, теперь позволяет спрашивать у Gemini, что изображено на картинках и на экране.

В прошлом году Google внедрил возможности Gemini в TalkBack [3], чтобы предоставить людям с нарушениями зрения [4] доступ к описаниям изображений, созданным искусственным интеллектом, даже если замещающий текст недоступен. Теперь люди могут задавать вопросы и получать ответы о своих изображениях.

Например, если друг пришлёт вам фотографию своей новой гитары, вы можете получить её описание и задать вопросы о марке и цвете. Кроме того, теперь вы можете получать описания и задавать вопросы обо всём, что отображается на экране вашего телефона. Так, если вы совершаете покупки в приложении, вы можете спросить у Gemini, из какого материала сделан интересующий вас товар или есть ли на него скидка.
Сегодня Google также объявил, что обновляет функцию Expressive Captions в Android, которая использует искусственный интеллект для распознавания того, что и как говорит человек.
Google сообщает, что знает о том, что один из способов самовыражения людей — растягивать звуки в словах, поэтому компания разработала новую функцию определения продолжительности в Expressive Captions. Теперь вы будете знать, когда спортивный комментатор называет «потрясааааающий удар» или когда кто-то говорит не просто «нет», а «неееет». Вы также начнёте видеть новые обозначения для звуков, например, когда человек свистит или откашливается.

Обновление доступно на английском языке в США, Великобритании, Канаде и Австралии для устройств под управлением Android 15 и более поздних версий.
Google также упрощает доступ к PDF-файлам в Chrome. До сих пор вы не могли использовать программу чтения с экрана для взаимодействия со сканированным PDF-файлом в браузере Chrome на компьютере. Теперь Chrome автоматически распознает такие PDF-файлы, позволяя выделять, копировать и искать текст, как на любой другой странице, и использовать программу чтения с экрана для их просмотра. Это стало возможным благодаря внедрению оптического распознавания символов (OCR), сообщает Google.
Кроме того, функция «Масштабирование страницы» в Chrome на Android теперь позволяет увеличивать размер текста, который вы видите, не влияя на макет веб-страницы. Вы можете настроить степень масштабирования, а затем выбрать, применять ли это изменение ко всем страницам, которые вы посещаете, или только к некоторым из них. Чтобы получить доступ к этой функции, нажмите на меню с тремя точками в правом верхнем углу Chrome.
Источник [5]
Автор: mefdayy
Источник [6]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/15256
URLs in this post:
[1] объявила: https://blog.google/outreach-initiatives/accessibility/android-gemini-ai-gaad-2025/
[2] интеллекта: http://www.braintools.ru/article/7605
[3] возможности Gemini в TalkBack: https://techcrunch.com/2024/05/14/google-talkback-will-use-gemini-to-describe-images-for-blind-people/
[4] зрения: http://www.braintools.ru/article/6238
[5] Источник: https://techcrunch.com/2025/05/15/google-rolls-out-new-ai-and-accessibility-features-to-android-and-chrome/
[6] Источник: https://habr.com/ru/companies/bothub/news/910036/?utm_source=habrahabr&utm_medium=rss&utm_campaign=910036
Нажмите здесь для печати.