Реализация AI агента на базе LLM с нуля – что включает цикл разработки
Разработка AI агента, использующего большие языковые модели (LLM) – это малоизвестный пока еще и потому интересный инженерный процесс, охватывающий весь цикл создания от идеи до финального развертывания. Технические стандарты разработки агентских систем пока еще формируются. В данной статье я поделюсь своим опытом и рассмотрю ключевые этапы, технологии и практические нюансы, которые встречаются при разработке такой системы с нуля.
Частые ловушки в экспериментах машинного обучения — рассказываем, что следует знать
Привет, Хабр! Я Павел Куницын, главный специалист по анализу данных и машинному обучению в ПГК Диджитал. Мы занимаемся разработкой цифровых продуктов в сфере железнодорожных грузоперевозок: интерактивной карты вагонного парка, оптимизатора ремонтов и других решений. В большинстве из них мы применяем машинное обучение.О том, как мы подходим к этому, я и мои коллеги рассказываем в нашем блоге на Хабре. Например, мы работаем
Моделирование экономического поведения с использованием LLM: сравнение моделей в кейнсианском конкурсе красоты
В последние годы исследования по моделированию экономического поведения с использованием искусственного интеллекта (ИИ) набирают обороты. Особенно интересен вопрос: насколько большие языковые модели (LLM) способны имитировать поведение людей в классических экономических экспериментах. В данной статье анализируется, как современные LLM решают задачу кейнсианского конкурса красоты и как их результаты отличаются от экспериментов с реальными людьми в работах Nagel (1995) и Grosskopf & Nagel (2008).Почему это важно?
От скриптов к сервисам: 10 книг для профессиональной разработки в Data Science
Привет! Меня зовут Марк Паненко, и я Chief Data Science в Ozon Банке. Сегодня я хочу поговорить про книги, которые научат писать код. В современной экосистеме Data Science недостаточно просто знать алгоритмы машинного обучения и статистические методы — необходимы прочные инженерные навыки для создания масштабируемых, поддерживаемых решений.Это третья часть серии статей о главных книгах для data-специалистов. В первой части «От комиксов до нейросетей» я писал о литературе для джунов. Во второй — «Код устареет, принципы — останутся
Как спрогнозировать вес птицы с помощью XGBoost: от предобработки данных до оптимизации модели
Привет, Хабр! Вот когда каждый грамм действительно имеет значение: если вам нужно спрогнозировать вес птицы перед продажей, чтобы экономить на кормах и оптимизировать производство. Меня зовут Михаил Чирков, я data scientist в R-Style Softlab и сегодня хочу поделиться с вами кейсом прогнозирования с помощью XGBoost, этот проект мы делали в рамках внедрения BI-системы для птицефабрики.
Researcher и Analyst: новые инструменты Microsoft для глубокого анализа
Microsoft внедряет инструмент «deep research» на основе ИИ в Microsoft 365 Copilot. Недавно в чат-ботах появилось множество агентов для проведения глубоких исследований, в том числе ChatGPT от OpenAI, Gemini от Google и Grok от xAI. В их основе лежат так называемые модели ИИ, способные решать задачи и проверять факты, навыки, которые важны для проведения глубоких исследований по теме. Направления Microsoft называются Researcher и Analyst.
Разработчики анонсировали SynCity — нейросеть для генерации 3D-миров в стиле градостроительных симуляторов
Разработчики из Visual Geometry Group и Оксфордского университета представили SynCity — нейросеть, которая генерирует 3D-миры в стиле градостроительных симуляторов. Готовые модели можно использовать в разработке игр или 3D-дизайне.
DeepSeek V3-0324. Что изменилось?
Все пишут, что Deep Seek V3-0324 ВНЕЗАПНО СТАЛ СИЛЬНО ЛУЧШЕ. И в чем именно?Ночью, без объявления войны, DeepSeek вырос на 19.8 баллов в математике и 10 баллов в кодировании. Также официально заявлены некоторые улучшения в понимании фронтенда и вызова тулов. Напоминаю, речь идет о нерассуждающей версии - она не рассказывает о своих мыслях как DeepSeek R1, зато работает более быстро и стабильно.Попробовать самостоятельно можно
Gemini 2.5 Pro. Большой контекст зарелизился
Никогда такого не было, и вот опять. Новый прорыв - Gemini 2.5 Pro.Это та самая сетка, которая недавно висела в топе LMArena под названием Nebula с разницей в скоре +40.

