llm. - страница 133

llm.

Кейс: разработать квест-мастера на нейронке

Инженерия подсказок, как и все, что связано с нейросетями, для непогруженного человека может показаться чем-то раздутым и незначительным. Нет, ну серьезно. Что трудного попросить ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ сочинить стишок или рассказать популярно что такое "Эпистемологический анархизм". Но на деле все действительно оказывается слишком, слишком, слишком нетривиально. Расскажу на примере пустяковой задачки: "Разработать ИИ-агента квест-мастера, который генерит загадки и отслеживает ее угадываемость".Доп.цель:

продолжить чтение

RAG-системы на арене: протестировали 5 популярных решений на реальных данных

продолжить чтение

Ollama от А до Я: как выбрать модель, настроить и интегрировать

Когда мы говорим об использовании больших языковых моделей (LLM), большинство людей сразу вспоминают облачные сервисы. Но далеко не всегда удобно или возможно работать через интернет: где-то мешают ограничения по приватности, где-то скорость соединения, а иногда просто хочется больше контроля над процессом. Именно для таких задач и существует Ollama — инструмент, который позволяет запускать современные языковые модели локально, буквально в пару действий.

продолжить чтение

AI Review: для всех, везде и без боли

ВступлениеВ этой статье я хочу рассказать про инструмент AI Review. Да, подобных решений уже немало — но этот особенный. Его цель — работать везде, с любыми стеками, на любых CI/CD, быть гибким, быстрым и простым в настройке. Короче, чтобы всё было “как мы любим”: всё есть, ничего не ломается, и при этом — без боли и лишней магии.Попробуем разобраться, как это работает и почему мне захотелось сделать свой AI Review.Примечание: это не рекламный пост и не очередной “AI-ревью, который всех спасёт”. AI Review

продолжить чтение

Векторная арифметика колбасы. Как объяснить жене нейропропмптинг на базе запроса «оливье с креветками»

Рецепт от нейрошефа

продолжить чтение

Первые 48 часов Claude Sonnet 4.5 — анализ отзывов разработчиков и выявленных проблем

Вчера вечером Anthropic представила Claude Sonnet 4.5

продолжить чтение

Геймер построил языковую модель с 5 млн параметров в Minecraft

Ютубер sammyuri построил в Minecraft большую языковую модель CarftGPT с 5 млн параметров. В конструкции используется более 438 млн блоков. Проект автор реализовал без модов и дата-паков. В основе только схемы из красного камня. 

продолжить чтение

Разработка LLM с нуля. Новые модели

Крупное обновление в моем курсе Разработка LLM с нуля.Напомню, в курсе мы с нуля разрабатываем модель GPT-1 и все необходимые для ее работы компоненты: токенизатор, эмбединги, механизм внимания и т.д. Вся разработка ведется на Python и низкоуровневых компонентах PyTorch.

продолжить чтение

Новый релиз DeepSeek V3.2-Exp — ускорение и снижение цен на API

продолжить чтение

Прямой диалог с лентой или будущее рекомендательных систем

продолжить чтение