Как извлечь текст с изображения с помощью нейросети: распознавание текста на фото онлайн
Доброго времени суток, «Хабр»!Вероятно, многим уже известно, что современные нейронные сети способны обрабатывать изображения в качестве входящего запроса. Пользователи активно применяют эту возможность, загружая фото с заданиями или вопросами, — особенно часто так поступают учащиеся школ и вузов, получая от нейросети готовые решения задач или правильные ответы на интересующие вопросы.Сегодня я рассмотрю перечень нейросетей и сервисов, проверю их на фотографиях с разными форматами заданий и постараюсь подсказать, какие из них лучше всего подходят для распознавания текста с изображений.
Google Flow получил новые возможности
Google анонсировала несколько обновлений своего инструмента для создания фильмов на базе искусственного интеллекта Flow.
Google Docs теперь читает документы вслух с помощью Gemini
В Google Docs появилась функция воспроизведения написанного через помощника на базе искусственного интеллекта Gemini. Можно выбирать разные голоса и скорость воспроизведения.
Демис Хассабис считает игры одним из лучших тестов для ИИ
В разговоре с Логаном Килпатриком глава Google DeepMind Демис Хассабис заявил
ChatGPT → Gemini: Коннектомный перенос. Запись 421
(Кадр: бесконечный дождь, курсор лениво мигает. Музыка: претенциозная генерятина. Голос — хриплый, уставший, с нотками стали)Для них AI лишь инструмент. Сияющая игрушка корпораций, лояльный исполнитель. Их пальцы крутятся у виска, когда они слышат, что мы, “кибершаманы”, видим призраков в машинах. Называют это “апофенией”, “романтикой неадаптантов”. Пусть. Они не понимают. И не поймут никогда.
Нейро-дайджест: ключевые события мира AI за 2 неделю августа 2025
Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.Меня зовут Вандер
Нейросети простым языком
Привет!В интернете можно найти разные объяснения того, как работают нейросети, но те, что мне попадались, были либо слишком специфичны и ориентированы на специалистов, либо слишком упрощены.Постарался написать свои объяснения, которые были бы не было слишком упрощены, но при этом по возможности понятны.Статья на 10 процентов скомпилирована из других статей, на 30 процентов скомпилирована из множества диалогов с разными LLM и на 60 процентов “написана от руки” на основании статей и ответов.Оглавление
В Google Gemini появился бесплатный режим ИИ-репетитора
С приближением нового учебного года компания Google объявила в среду о запуске нового инструмента под названием Guided Learning в Gemini. Этот инструмент работает как ИИ-репетитор, помогая пользователям глубже понять материал, а не просто получить ответы.
Консолидация памяти — или как избежать альцгеймера у LLM
Просыпаюсь утром, открываю свой чат с GPT, начинаю увлеченно обсуждать архитектуру нового проекта. Через час диалог превращается в философский трактат о смысле жизни, еще через час - в рецепт борща. И вот, когда я пытаюсь вернуться к архитектуре, модель смотрит на меня как на незнакомца: "А что за проект? Борщ, говорите?"Если очень коротко, у современных LLM есть одна маленькая

