llm.

Итоги LLM в 2025 году: прогресс, проблемы и прогнозы

Один из лучших обозревателей в мире LLM выпустил масштабный разбор всего самого важного, что случилось с языковыми моделями в 2025 году. Я перевел, чтобы как можно больше людей прочитало этот фундаментальный труд. Дальше — слово автору.На исходе 2025 года предлагаю оглянуться на ключевые достижения в области больших языковых моделей (LLM) и проанализировать оставшиеся ограничения и нерешенные проблемы, а также высказать несколько соображений о дальнейшем развитии событий.

продолжить чтение

Оставлено в

АИС «Налог-3»: почему это одна из самых мощных государственных IT-систем России

ПредисловиеЗа последнее десятилетие Федеральная налоговая служба (ФНС) совершила фундаментальный переход от традиционной модели администрирования к подходу, основанному на анализе больших баз данных.Если вы соприкасались с налоговой системой - проходили проверки, бывали на комиссиях в инспекциях, общались с налоговыми органами, то вы слышали про АИС «Налог-3», одну из самых масштабных государственных IT-платформ в России.

продолжить чтение

Оставлено в

Новое исследование: LLM используются для обучения и оценки автономных агентов

Новые результаты

продолжить чтение

Оставлено в

Локальный Tool Calling или «У нас есть BFCL-V4 дома»

В своей прошлой статье я рассказывал о компактной модели, которая по бенчмаркам смогла превзойти модели в 10 раз больше ее самой. О том, что это стало возможным благодаря особому подходу к обучения самой модели и что такую модель вполне реально запустить у себя локально.Однако, когда дело касается локального запуска, думаю, далеко немногие из нас запускают модели в BF16 через vLLM на Nvidia H100. А значит, все эти красивые результаты по бенчмаркам на практике, вероятнее всего, очень далеки от того, что мы получим на практике.И я решил это проверить.

продолжить чтение

Оставлено в

Как заработать на LLM, перестав писать «правильные промпты»

В этой статье я бросаю вызов общепринятому представлению о больших языковых моделях как о «тупых исполнителях», которые ничего не понимают, галлюционируют, но позволяют получить результат быстрее (нередко за счет качества). Подобные мифы активно распространяются в сети, а также на курсах, на которых обучают «правильно» писать промпты. Я на Хабре уже написал несколько статей, разоблачающих отсутствие мышления у LLM, но здесь я опишу способность больших языковых моделей решать задачи, людям недоступные

продолжить чтение

Оставлено в

MCP Tool Registry: автоматизированное создание систем RAG

Всем привет! Меня зовут Максим Максимов, я — NLP-инженер в AI R&D лаборатории в red_mad_robot. Мы работаем с прикладными AI-системами, проводим эксперименты и проверяем архитектурные подходы в реальных сценариях.

продолжить чтение

Оставлено в

От «нейросетей без VPN» до ИИ-платформы на 1,5 млн пользователей: кейс GPTunneL

От внутреннего прототипа к 1,5 млн пользователейВсё началось в 2023-м: я вместе со своим партнером, Ильей, руководил командой разработчиков ScriptHeads. За нашими спинами - 15 лет опыта в IT, в том числе в высоконагруженных банковских системах. Мы остро нуждались в ИИ для кодинга без VPN и без сложностей. Собрали прототип GPTunneL, это был, фактически, внутренний инструмент. Отказоустойчивый и надежный, ибо писали опытные прогеры для себя. Почти случайно мы показали его своим клиентам и я увидел огромный интерес к ИИ. Мы добавили в проект дополнительные модели, протестировали и открыли для всех.

продолжить чтение