llm. - страница 84

llm.

Запускаем Qwen3-VL-30B на 48GB VRAM

Недавно вышла коллекция моделей от Alibaba - Qwen3-VL:https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbeЭта модель не только "языковая", но ещё и "глазастая"В своём блоге они

продолжить чтение

Как выжать максимум смысла из тысяч строк кода

продолжить чтение

Автоматизация A-B-экспериментирования

Я сейчас работаю над автоматизированной системой A/B-экспериментирования заголовков и/или обложек статей и новостей на одной медиа-платформе в одиночку. Решил рассказать вам, как эта система работает и показать некоторые технические нюансы. Сразу оговорюсь, что название и сферу упоминать не стану, система находится в разработке, но есть, что рассказать.Немного об экспериментах

продолжить чтение

Рецепт vLLM с мистралем. Часть 1

На первом этапе нашей заготовки модели мы займемся ее 4-х битным квантованием, а во второй части будем использовать vLLM для запуска парралельных запросов к ней.Поехали!

продолжить чтение

Зоопарк фреймворков для AI-агентов: как выбрать подходящий — делаем бенчмарк и большое сравнение

Привет! В этой статье я детально разберу основные фреймворки для AI-агентов, попробую их побенчить и детально распишу их плюсы и минусы. Если вы подступались к агентам, то первым вопросом наверняка стало «а на чем их делать?». Отовсюду все говорят про langchain и десяток других фреймворков, звучат аббревиатуры типа MCP и A2A, какие-то Swarmы и CrewAI, мультиагентность и самое всякое разное.

продолжить чтение

Как попасть в ответы ChatGPT, Perplexity и Google AI: практическое руководство по GEO

Когда первая позиция в Google перестала гарантировать трафикТри месяца назад ко мне обратился клиент с проблемой, которую я теперь вижу еженедельно. Позиции в топ-3 Google по всем ключевым запросам. Контент написан экспертами с многолетним опытом. Техническая оптимизация выполнена безупречно — скорость загрузки под секунду, мобильная версия идеальна, Core Web Vitals в зелёной зоне.Трафик падает. Минус 35% за квартал.

продолжить чтение

Как с помощью ИИ быстро найти общий язык с заказчиком

Источник: https://funny.klev.club/

продолжить чтение

Как мы подключали грибы к нейронкам, собирали кастомные серваки и другие челленджи для гостей Yandex Neuro Scale

продолжить чтение

Структурированные данные в 2025: от rich snippets до ответов LLM — что реально работает

Полное руководство по Schema.org с кейсами, источниками и чек-листом внедренияКогда Google перестал быть просто поисковикомПомните, как выглядел поиск пять лет назад? Десять синих ссылок. Всё просто.Сегодня другая реальность. Открываете Google — и видите AI Overview с готовым ответом. Спрашиваете ChatGPT о ресторанах поблизости — получаете структурированный список с рейтингами, адресами, временем работы. Ищете рецепт в Perplexity — система уже разложила ингредиенты, показала калорийность, добавила пошаговую инструкцию.Откуда AI знает всё это?

продолжить чтение

Агент-исследователь: как научить LLM работать с поиском в интернете

продолжить чтение

Rambler's Top100