Как извлечь текст с изображения с помощью нейросети: распознавание текста на фото онлайн
Доброго времени суток, «Хабр»!Вероятно, многим уже известно, что современные нейронные сети способны обрабатывать изображения в качестве входящего запроса. Пользователи активно применяют эту возможность, загружая фото с заданиями или вопросами, — особенно часто так поступают учащиеся школ и вузов, получая от нейросети готовые решения задач или правильные ответы на интересующие вопросы.Сегодня я рассмотрю перечень нейросетей и сервисов, проверю их на фотографиях с разными форматами заданий и постараюсь подсказать, какие из них лучше всего подходят для распознавания текста с изображений.
От 3d к AI, собственный опыт и размышления
Привет всем читателям замечательного Хабра! Может кто-то из вас припомнит мою статью, вышедшую в конце 21-го года. Тогда я спешил поделиться первым опытом создания мультфильма, про волка-кулинара и его «мишленовскую» яичницу :) Признаюсь, что пользователи Хабра оказались самыми благодарными зрителями и читателями, такого большого фидбека я не получал ни с одной из социальных сетей. Огромная вам благодарность. После такой доброжелательной реакции, я захотел делать продолжение и строил радужные планы.
Google Flow получил новые возможности
Google анонсировала несколько обновлений своего инструмента для создания фильмов на базе искусственного интеллекта Flow.
В SharePoint Pages внедрят инструмент для создания контента
Microsoft запустила новую функцию под названием «Разделы с ИИ» (Sections with AI) в SharePoint. Это инструмент для разработки, который создаёт разделы на основе запроса.
GPT-OSS-20B – 120B: Сухие цифры после реальных тестов
OpenAI выпустила GPT-OSS модели (https://huggingface.co/openai/gpt-oss-20b и https://huggingface.co/openai/gpt-oss-120b) , и сообщество немедленно начало экспериментировать. Но реальные бенчмарки производительности найти сложно. В этой статье представлены результаты нашего практического тестирования на арендованном железе через RunPod с использованием Ollama.Ремарка: Тесты проводились на Ollama для быстрого деплоя. Если будете использовать vLLM, то производительность будет примерно +30%, но он слабо адаптирован под консьюмерские GPU, за исключением RTX 5090. Что тестировалось:
Строим корпоративную GenAI-платформу: от концепции до ROI. Часть 1. Зачем генеративному ИИ нужна особая архитектура
Это первая статья из серии «Строим корпоративную GenAI-платформу: от концепции до ROI». В этой серии я расскажу, как компаниям подойти к внедрению генеративного ИИ (GenAI) системно, чтобы получить пользу и избежать подводных камней. Кому будет полезно. В первую очередь ИТ-архитекторам, инженерам по ИИ и руководителям в технологиях. Я разберу путь от первых концепций до измеримых результатов (ROI) и постараюсь дать практические рекомендации на каждом этапе.О серии статей.
Microsoft тестирует функцию COPILOT() в Excel по аналогии с AI() в «Таблицах» Google
В апреле Google анонсировала новую функцию AI() Gemini для своего редактора электронных таблиц, чтобы передать в них запрос с необязательным контекстом и получить результат напрямую. Теперь Microsoft тестирует аналогичную функцию COPILOT() в Excel.
