Как устроены LLM-агенты: архитектура, планирование и инструменты
Всем привет! С вами Кирилл Филипенко, сисадмин из Selectel, и сегодня мы погрузимся в тему LLM-агентов. Сейчас об этих самых «агентах» кричат буквально из каждого утюга, поэтому пришло время наконец-то разобраться, что это такое, как они работают и с чем их, собственно, едят. Прыгайте под кат, будет интересно!
Европейские страны разрабатывают системы искусственного интеллекта на базе Nvidia Blackwell
Сообщается, что несколько европейских стран разрабатывают системы искусственного интеллекта на базе архитектуры Blackwell от Nvidia. Франция, Италия, Испания и Великобритания сотрудничают с технологическими и облачными провайдерами, такими как Domyn, Mistral AI, Nebius и Nscale, а также с телекоммуникационными компаниями, такими как Orange, Swisscom, Telefónica и Telenor, для создания инфраструктуры, которая, как ожидается, обеспечит вычислительную мощность более 3000 экзафлопс.
OpenAI o3-pro может оказаться слишком умным для светской беседы
Компания OpenAI запустила o3-pro для пользователей Pro в ChatGPT и через API. Новая модель предназначена для предоставления более надёжных и подробных ответов за счёт использования большей вычислительной мощности, хотя это приводит к заметному замедлению времени ответа даже на простые запросы.
Вычисление функции потерь и градиентов в AI переводчике
Привет, Хабр!Меня зовут Алексей Рудак, я основатель компании Lingvanex, которая разрабатывает решения в области машинного перевода и транскрипции речи. Продолжаю цикл статей о том, как устроен переводчик на нейронных сетях изнутри. И сейчас хочу рассказать про работу функции потерь. Для тренировки модели используется opensource фреймворк OpenNMT-tf.
Согласно данным Ramp, внедрение корпоративного ИИ замедляется
Значительная часть корпоративной Америки с энтузиазмом приняла ИИ, полагая, что эта технология принесёт невероятный прирост производительности. Но, согласно данным о транзакциях финтех-компании Ramp, внедрение ИИ может замедлиться.
Модель Google Gemini 2.5 Pro превосходит модель OpenAI o3 в обработке сложных и длинных текстов
В настоящее время Google Gemini 2.5 Pro лидирует в тесте Fiction.Live на обработку сложных и длинных текстов. Тест измеряет, насколько хорошо языковые модели могут понимать и точно воспроизводить сложные истории и контексты — задачи, которые выходят далеко за рамки простых функций поиска, таких как те, что оцениваются в популярном тесте «Иголка в стоге сена».
Не гугли — собери ИИ-агента, который сам ищет, пишет и помогает с кодом
Поспорил с коллегой, что соберу своего ИИ-агента за вечер. Он посмеялся, я завёл терминал.За 19 лет в айти я участвовал в автоматизации процессов, писал ботов, даже обучал нейросети для поиска багов. Но вот чтобы сделать персонального ИИ-агента — такого, который реально помогает, а не просто болтает — руки не доходили. Пока не появился повод в виде лёгкой подколки в чате.Пошёл по трём направлениям: кастом на LangChain, локальная сборка через Ollama и no-code-конструкторы. Где-то пришлось попотеть с кодом, где-то — удивиться, насколько просто всё работает.
Как я на спор делал ИИ-агента: 3 пути, 2 часа, 1 кэс
Поспорил с коллегой, что соберу своего ИИ-агента за вечер. Он посмеялся, я завёл терминал.За 19 лет в айти я участвовал в автоматизации процессов, писал ботов, даже обучал нейросети для поиска багов. Но вот чтобы сделать персонального ИИ-агента — такого, который реально помогает, а не просто болтает — руки не доходили. Пока не появился повод в виде лёгкой подколки в чате.Пошёл по трём направлениям: кастом на LangChain, локальная сборка через Ollama и no-code-конструкторы. Где-то пришлось попотеть с кодом, где-то — удивиться, насколько просто всё работает.

