llm.
Итоги LLM в 2025 году: прогресс, проблемы и прогнозы
Один из лучших обозревателей в мире LLM выпустил масштабный разбор всего самого важного, что случилось с языковыми моделями в 2025 году. Я перевел, чтобы как можно больше людей прочитало этот фундаментальный труд. Дальше — слово автору.На исходе 2025 года предлагаю оглянуться на ключевые достижения в области больших языковых моделей (LLM) и проанализировать оставшиеся ограничения и нерешенные проблемы, а также высказать несколько соображений о дальнейшем развитии событий.
АИС «Налог-3»: почему это одна из самых мощных государственных IT-систем России
ПредисловиеЗа последнее десятилетие Федеральная налоговая служба (ФНС) совершила фундаментальный переход от традиционной модели администрирования к подходу, основанному на анализе больших баз данных.Если вы соприкасались с налоговой системой - проходили проверки, бывали на комиссиях в инспекциях, общались с налоговыми органами, то вы слышали про АИС «Налог-3», одну из самых масштабных государственных IT-платформ в России.
Локальный Tool Calling или «У нас есть BFCL-V4 дома»
В своей прошлой статье я рассказывал о компактной модели, которая по бенчмаркам смогла превзойти модели в 10 раз больше ее самой. О том, что это стало возможным благодаря особому подходу к обучения самой модели и что такую модель вполне реально запустить у себя локально.Однако, когда дело касается локального запуска, думаю, далеко немногие из нас запускают модели в BF16 через vLLM на Nvidia H100. А значит, все эти красивые результаты по бенчмаркам на практике, вероятнее всего, очень далеки от того, что мы получим на практике.И я решил это проверить.
Как заработать на LLM, перестав писать «правильные промпты»
В этой статье я бросаю вызов общепринятому представлению о больших языковых моделях как о «тупых исполнителях», которые ничего не понимают, галлюционируют, но позволяют получить результат быстрее (нередко за счет качества). Подобные мифы активно распространяются в сети, а также на курсах, на которых обучают «правильно» писать промпты. Я на Хабре уже написал несколько статей, разоблачающих отсутствие мышления у LLM, но здесь я опишу способность больших языковых моделей решать задачи, людям недоступные
MCP Tool Registry: автоматизированное создание систем RAG
Всем привет! Меня зовут Максим Максимов, я — NLP-инженер в AI R&D лаборатории в red_mad_robot. Мы работаем с прикладными AI-системами, проводим эксперименты и проверяем архитектурные подходы в реальных сценариях.
От «нейросетей без VPN» до ИИ-платформы на 1,5 млн пользователей: кейс GPTunneL
От внутреннего прототипа к 1,5 млн пользователейВсё началось в 2023-м: я вместе со своим партнером, Ильей, руководил командой разработчиков ScriptHeads. За нашими спинами - 15 лет опыта в IT, в том числе в высоконагруженных банковских системах. Мы остро нуждались в ИИ для кодинга без VPN и без сложностей. Собрали прототип GPTunneL, это был, фактически, внутренний инструмент. Отказоустойчивый и надежный, ибо писали опытные прогеры для себя. Почти случайно мы показали его своим клиентам и я увидел огромный интерес к ИИ. Мы добавили в проект дополнительные модели, протестировали и открыли для всех.
Сделай бота для работы
Управление AI-агентами с помощью чат-сообщенийСогласно Hype Cycle от Gartner
Когда уязвим не ИИ, а браузер: атака Man-in-the-Prompt
Изображение сгенерировано ИИ
Что такое Deep Research агенты и зачем они нужны?
В свете недавнего выхода обновления Deep Research для Gemini стоит разобраться, как этот и подобные ему агенты работают.

