llm.
Мульти-модельная оркестрация LLM: архитектура маршрутизации, которая снизила затраты в 117 раз
Как мы провели 12,000+ API-вызовов к 11 моделям, открыли правило 60-70, и построили систему маршрутизации с ROI 4,853xКонтекст: кто пишет и о чём эта статьяИгорь Масленников. В IT с 2013 года. Последние два года развиваю AI Dev Team в DNA IT — подразделение, которое работает на мульти-модельной архитектуре. Это техническая статья о том, как мы построили систему оркестрации LLM-моделей для платформы генерации образовательных курсов.Статья для тех, кто:Строит AI-продукты и упирается в стоимость APIДумает о мульти-модельной архитектуре, но не знает, с чего начать
Сравнительный анализ 18 LLM моделей: конец монополии?
Сравнительный анализ 18 LLM моделей: конец монополии?Ноябрь 2025 — месяц, когда open-source модели официально догнали проприетарные. Разбираем, что произошло, кто теперь на вершине, и как это использовать в своих проектах.
Применение локальных LLM для OCR
Вдруг кому-то будет полезно. Возникла задача быстрого распознавания данных с фотографий и получения из них структурированной информации. Так же важно было отсутствие требовательного к ресурсам ПО и легкость разворачивания системы. Поэтому было решено попробовать использовать в качестве подключаемого модуля мультимодальные LLM запускаемые под Ollama, т.к. у неё есть REST API по которому удобно обращаться к модели.В последних версиях Ollama появился графический интерфейс, но он неудобен. Модели в ollama проще всего загрузить из командной строки. Например: ollama pull codellama.
Claude Code: держите контекст чистым, а контроль — под задачу
ВведениеЯ сижу в Claude Code с релиза — каждый день, на реальных задачах. Успел побыть и скептиком («очередная хайповая штука»), и фанатиком («агент всё сделает сам»). В итоге пришёл к набору правил, которые помогают не скатываться в крайности.Для меня Claude Code — лучший агент на рынке. Cursor, Gemini CLI, Codex пробовал, но разница ощутимая. Anthropic реально вкладываются в продукт и регулярно добавляют фичи.Статья для тех, кто начинает работать с Claude Code. Опытным многое будет знакомо, но наверняка что-то зацепит. Две части: как не засорять контекст и как менять подход в зависимости от задачи.Следите за размытием контекстного окна
Интеллект в графе: как структурированное знание становится капиталом
Предыстория и мотивацияВ современном цифровом предприятии знания перестали быть статичными документами — они живут, развиваются и меняются вместе с системой.Каждый сервис, процесс, интерфейс или поток данных является носителем смыслов, и все эти смыслы взаимосвязаны.Чем сложнее организация, тем важнее становится способность сохранять и использовать знания в структурированном виде.Почему это важноКогда знание зафиксировано только в презентациях, описаниях или локальных моделях — оно быстро устаревает.В отличие от этого, структурированное знание
Поиск в личном фото архиве по текстовому описанию
Почти у каждого есть личный фото архив, бережно собираемый годами. Бывает так что времени на раскидывание фото по нужным папкам для быстрого поиска, не хватает. И этот фото архив представляет из себя мягко говоря свалку до которой никак не доходят руки.Как бы сделать так, что бы опять ничего не делать, но быстро найти нужное фото? Написать человеческий запрос "корабль на берегу моря" и быстро получить результат в виде нескольких фото где есть корабль, берег и море. Или написать "новый год" и получить все фото так или иначе связанные с новым годом.Для этого нам понадобится: мультимодальная модель
Протестировал 8 брендов LLM на честность, логику и креатив. Claude победил, но Алиса неожиданно в топ-3
Бенчмарки LLM множатся как грибы после дождя, но обычному пользователю от них мало толку. Оценки программирования, математики, этики — всё это важно для разработчиков, но что, если вы просто хотите получить помощь в повседневных задачах?Я решил проверить популярные модели на том, что действительно важно:- Креативность без потери здравого смысла - Логика без галлюцинаций - Внимание к деталям без педантизма Все промпты — в статье. Можете повторить и проверить мои выводы.
ИИ-ассистенты: как AI делит рынок разработки
Команда AI for Devs подготовила перевод статьи о том, как быстро растущие AI-ассистенты меняют саму природу разработки. Их код выглядит безупречно — но всё чаще решает не ту задачу, что стоит перед нами. Где проходит граница между ускорением и самообманом, и какую новую ответственность это накладывает на инженеров?В начале 1950-х Грейс Хоппер ввела термин «компилятор» и создала одну из первых его версий — систему A-0

