Современные OCR для сложных документов: сравниваем 6 open-source моделей на реальном кошмаре инженера
Привет, Хабр! Каждый, кто хоть раз пытался вытащить данные из скана акта или старого отчета, знает эту боль. Классические OCR-инструменты, вроде старого доброго Apache Tika, отлично справляются с простым печатным текстом, но пасуют перед реальными вызовами: таблицами со сложной вёрсткой, рукописными пометками, мелким курсивом и разными шрифтами в одном документе.Чтобы не быть голословными, давайте посмотрим на типичный «сложный» документ и что с ним делает Tika.
Alibaba представила превью reasoning-версии Qwen3-Max-Thinking
Китайская компания Alibaba представила предварительную версию своей новой модели Qwen3-Max-Thinking, которая позиционируется как экспериментальная reasoning-модификация флагманской линейки Qwen3-Max. Разработка ориентирована на сложные задачи, требующие логического мышления и многошаговых рассуждений.
Airbnb выбрал китайского ИИ-агента от Alibaba вместо ChatGPT
Американский сервис по бронированию жилья Airbnb выбрал ИИ-агента Quark на базе языковой модели Qwen3 от китайской Alibaba Cloud вместо решений OpenAI и других конкурирующих компаний. Чат-бот Quark предлагает функции текстового и голосового общения, подобные ChatGPT. Alibaba Cloud — это подразделение Alibaba, базирующееся Ханчжоу и занимающееся искусственным интеллектом и облачными сервисами.
От GPT-2 к gpt-oss: анализ достижений архитектуры
И как они выглядят на фоне Qwen 3📌 Telegram @TheWeeklyBrief — краткие обзоры и подкасты 📌 GitHub Pages — углублённые разборы статей5 августа, 2025 года OpenAI выпустила новые модели LLM с открытым весом: gpt-oss-120b и gpt-oss-20b — первые полностью открытые модели с момента выхода GPT-2 в 2019 году. И да, благодаря некоторым умным оптимизациям, их можно запускать локально (но об этом чуть позже).
Запускаем Qwen3-VL-30B на 48GB VRAM
Недавно вышла коллекция моделей от Alibaba - Qwen3-VL:https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbeЭта модель не только "языковая", но ещё и "глазастая"В своём блоге они
GPT-5 победил в необычном бенчмарке Among AIs
Команда 4Wall AI представила Among AIs: бенчмарк, в котором разные ИИ соревнуются в Among Us. Это вдохновленная "Мафией" видеоигра, правила которой были слегка упрощены для бенчмарка: на космическом корабле есть пять мирных, которые выполняют задания, и один "самозванец" (Impostor), который может саботировать и даже убивать мирных. При обнаружении трупа оставшиеся собираются, чтобы обсуждением и голосованием определить самозванца, который будет выброшен в открытый космос. Нередко самозванцем оказывается один из мирных, его называют scapegoat (козел отпущения).

