llm.
Google LangExtract: новая библиотека для извлечения структурированных данных из текста с помощью LLM
Google представил LangExtract — новую open-source библиотеку на Python, разработанную для эффективного преобразования больших объемов неструктурированного текста в удобные для анализа структурированные данные. Она предоставляет легковесный интерфейс для работы с большими языковыми моделями (LLM), такими как Gemini, открывая новые возможности для автоматизации извлечения информации.
Промт для изучения чего угодно: протокол Олега-Деминга
Эта статья отвечает на вопрос: как выучить что угодно с нейросетями, не прикладывая усилий к написанию промтов.В какой-то момент в голову пришла мысль, что с появлением нейросетей книги устарели. "Книги" будущего — это специальным образом закодированные знания внутри нейросети. Учиться надо в диалоге с нейросетью.На практике оказалось, что выполнить такой совет достаточно непросто. Да, ты можешь сходить к нейросети и сказать "научи меня матану". Проблема в том, что задавать правильные вопросы мало кто умеет. А кто умеет — знает, что это само по себе непросто.
Новый метод поиска от Sakana: расширение inference-time scaling и коллективный разум
Аналитический центр red_mad_robot продолжает разбирать исследования японской лаборатории Sakana AI — в прошлый раз
Как мы ускорили проверку документации с помощью AI-агента: от боли к решению
Привет, Хабр! Я — Мила Муромцева, системный аналитик в Альфа-Банке. Пишу эту статью, чтобы поделиться нашим опытом, а с кодом и техчастью мне помогает наш разработчик Миша Буторин. Расскажем, как мы научили LLM проверять документацию для платформы Альфа-Онлайн: переписали стандарт, поборолись с токенами и немного с хаосом.TL;DR (если коротко)Мы разработали и внедрили AI-агента в процесс ревью документации на платформе Альфа-Онлайн (веб-приложение Альфа Банка). Этот инструмент автоматизирует проверку документации, освобождая аналитиков от рутинных задач.
СontentCapture+LLM: как мы ускорили работу с неструктурированными документами
В эпоху цифровой трансформации каждая минута работы с документами на вес золота. Юридические отделы, банки, госучреждения ежедневно обрабатывают сотни договоров, доверенностей и судебных приказов. Ручной ввод данных, поиск реквизитов и проверка сроков могут отнимать до 20 минут на документ — и это если сотрудник не отвлекся на кофе. В нашей линейке продуктов есть универсальная IDP-платформа ContentCapture
Retrieval-Augmented Generation (RAG): глубокий технический обзор
Retrieval-Augmented Generation (RAG)
Яндекс победил шум
Бывало с вами так - лежишь в ванной, хочешь посмотреть видео с конями, кричишь "Алиса!", а колонка тебя не слышит из-за льющейся воды, работающего телевизора, пылесоса, чайника, соседа с перфоратором, блядской стройки за окном?Один из способов - жениться на женщине по имени Алиса, но тогда вам придется растить детей, убирать срач в доме и ездить в глупые отели в эмирате Дубай. Должно существовать более эффективное решение, не требующее обратной дискриминации мужчин.Инженеры (ни в коем случае не рисёчеры) из Яндекса посмотели на эту проблему, и, похоже, нашли элегантное решение. Почитать подробней пейпер можно
Неделя в российском AI: от управления «мыслями» нейросетей до победы человека над ИИ
Собрали главные события недели с 21 по 26 июля 2025 года в российском AI-сегменте: технические прорывы, корпоративные внедрения и неожиданные результаты соревнований человека с машиной.TabM от Yandex Research превзошел градиентный бустинг на табличных данныхКоманда Артема Бабенко из Yandex Research представила TabM (Tabular Mixer) — архитектуру, специально разработанную для табличных данных. В отличие от попыток адаптировать трансформеры, исследователи создали решение с нуля.Результаты впечатляют:На 46 benchmark-датасетах TabM показал средний ранг 1.8 против 2.4 у XGBoost
Мои первые впечатления от программирования с ИИ
Вы уже пробовали писать код с помощью инструментов ИИ? В этой статье я поделюсь одним из своих первых опытов кодирования с помощью ИИ.Предыстория. Делал я когда-то кастомную систему управления файлами для моих задач. Делал я ее для себя. Для своего удобства в работе и не только. Но сейчас не про эту систему. А про то, что идеальным дополнением этой системы мог бы стать кастомный скриншотер, который обладал бы определенным набором функций редактирования и сохранения скриншотов.

