Анализ и проектирование систем. - страница 6

Внутри vLLM: Анатомия системы инференса LLM с высокой пропускной способностью

Привет! Этот пост — перевод очень хардовой статьи про внутренности vLLM и того, как устроен инференс LLM. Переводить было сложно из-за англицизмов и отсутствия устоявшегося перевода многих терминов, но это слишком классная статья, и она обязана быть на русском языке! А дальше — слово автору:От paged attention, непрерывного батчинга, кэширования префиксов , specdec и т.д. — до мульти-GPU и мультинодового динамического сервинга LLM под нагрузкой.

продолжить чтение

От LangChain к LangGraph: детально разбираемся с фреймворками и всей Lang-экосистемой

LangChain или LangGraph? Какой фреймворк для ии-агентов выбрать? А может быть LangSmith? Или LangFuse? LangFlow? Если вы сходу не отличаете все эти Lang между собой или просто хочется побольше узнать о внутренностях LangChain и LangGraph, то добро пожаловать в эту статью, которую мне хотелось сделать фундаментальной, чтобы ответить сразу на все возникающие вокруг LangChain вопросы.Поговорим про архитектурные различия между LangChain и LangGraph, их подходы, посмотрим как это выглядит в коде, поищем лучшие точки применения и взглянем на сформированную экосистему вокруг.

продолжить чтение

За гранью человеческой интуиции: как ИИ создает странные, но сверхэффективные аналоговые микросхемы

Прорыв, который поставил инженеров в тупикИнтегрированные схемы и микросхемы миллиметрового и терагерцового диапазонов, как ожидается, станут основой будущих беспроводных сетей и систем высокоточного зондирования. Однако их проектирование - это вовсе не «щёлк-щёлк в CAD и готово». Это многолетний опыт, бесконечная ручная настройка топологий, совместное проектирование с заранее выбранными шаблонами электромагнитных структур и горы симуляций.

продолжить чтение

Оглушающая музыка тишины

ВведениеВ уже далеком 2000 году посчастливилось мне побывать на всероссийском слете экологов в Пушкиногорье. Много интересного там приключилось, но остановлюсь на одном воспоминании.

продолжить чтение

Пожиратель токенов (или нет): анатомия протокола MCP для ИИ-агентов

Поводом написания этой статьи послужил подслушанный диалог:— А на чем у вас агенты написаны?— У нас на MCP!Для меня MCP всегда был просто протоколом, то есть именно способом отправки и обработки запросов. А когда я слушал выступления или читал некоторые статьи о том, как плох/хорош MCP, меня не покидало ощущение чего-то странного. Но я все же решил, что это от незнания и я чего-то не понимаю. А когда не понимаешь, но очень хочешь понимать, то самый лучший способ — это взять и разобраться.

продолжить чтение

Зачем ИИ системному аналитику

продолжить чтение

Неизбежна ли война между человеком и искусственным интеллектом?

продолжить чтение

ЗАВОД НА ВСЕ 100! КАК ПОЛУЧИТЬ КОНКУРЕНТНОЕ ПРЕИМУЩЕСТВО ЗА СЧЕТ РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ ДЛЯ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ

Часть 1. «Цифровая пена» всё сильнее затягиваетС одной стороны за несколько сотен лет принципиально не изменилась логика производства продукта: оборудование и рабочие на основании технологических карт/рецептур перерабатывают сырье и материалы в полуфабрикаты и готовую продукцию, передавая результат своей работы дальше по участкам до склада готовой продукции для отгрузки покупателям, при этом собственники ожидают максимальной отдачи от инвестиций.

продолжить чтение

Как российским властям привлечь на свою сторону IT-шников и прочих интеллектуалов?

Попытаться найти общий язык никогда не поздно!Давайте признаем, что у российской власти есть некоторые проблемы с лояльностью российских же IT-шников

продолжить чтение

Три кита управляемого ИИ: От хаоса «чёрного ящика» к прозрачности и прибыли

Введение: Иллюзия эффективности, или почему ваш ИИ учится вам лгать

продолжить чтение

1...456789...20...22
Rambler's Top100