ai-агенты.

Работает ли Caveman? Тестируем модный скилл для экономии токенов

Недавно копайлот перешёл на новую тарификацию, из-за которой я упёрся в месячные лимиты буквально за первую рабочую неделю. В рабочих чатиках все стали искать способ экономить токены, и среди разных предложений стабильно мелькал скилл под названием Caveman.Что он обещает? Идея простая — скилл указывает нейронке говорить, как пещерный человек, убирать артикли, говорить коротко и думать лаконично. На первых строках README обещается экономия до 75%. При этом без потери качества!

продолжить чтение

Оставлено в

LLM становятся умнее, но есть ценность, до которой они не дотянутся. Где она?

Привет! Меня зовут Саша Журавлев. Я основатель и управляющий партнер фонда Mento VC. Мы инвестируем в технологические компании на стадиях Seed / Series A в США, Великобритании и Израиле, а в своем телеграм-канале рассказываю, как вижу рынок и принимаю инвестиционные решения.На прошлой неделе Сара Гуо (основательница AI фонда Conviction, ~$300 млн под управлением) написала статью о том, что есть работа, которую невозможно свести к стандарту или измерить. А раз нельзя измерить – нельзя и обучить модель делать ее лучше.

продолжить чтение

Оставлено в

Гайды Anthropic для Fable 5 и Opus 4.8 советуют противоположное, у OpenAI — третий путь. Что менять в промптах

Гайды Anthropic для Fable 5 и Opus 4.8 дают противоположные советы по одним и тем же темам. Opus спавнит мало субагентов — его надо подталкивать; Fable делегирует охотно — его надо ограничивать. Для Opus стартовый effort — xhigh, для Fable — high.Оба вендора официально сошлись в главном: новая модель — переписывай промпт. OpenAI: «treat GPT-5.5 as a new model family to tune for, not a drop-in replacement». Anthropic: скиллы для прежних моделей «слишком прескриптивны» для Fable 5 и снижают качество.OpenAI выносит управление поведением в параметры API (reasoning_effort, verbosity, phase), Anthropic — в текст промпта

продолжить чтение

Оставлено в

Месяц с LLM Wiki Андрея Карпатого: главная сила LLM — не в пересказе, а в умении «связывать» знания

ВступлениеЧитать статьи и веб-материалы через суммаризацию от LLM — это уже почти норма. Даже один только разбор общей картины плюс диалоговые вопросы заметно поднимают эффективность обучения.Но такой способ замыкается в одной сессии. А то, что по-настоящему определяет качество исследования и обучения, — это инсайты, рождающиеся из связей между материалами, прочитанными в разное время.

продолжить чтение

Оставлено в

Не просто чат-бот: как мы встраиваем MCP-агентов в корпоративную платформу SimpleOne

ИИ-агенты уже умеют писать письма, резюмировать встречи и искать ответы в базе знаний. Но в корпоративной среде этого мало. Пока агент только работает с текстом, он остаётся помощником рядом с процессом, а не участником самого процесса.

продолжить чтение

Оставлено в

Нужно ли использовать Qwen? Качество и цена

Текст носит юмористический характер и написан для @mahmud90 и @MountainGoatКитайские модели стоят в разы дешевле западных — и каждый месяц кто-нибудь спрашивает: а можно ли просто пересесть на Qwen и не платить за Claude с GPT? Я взял одну реальную задачу и прогнал её через три модели сразу, а потом свёл качество с ценой. Ниже — что получилось и кому Qwen реально подойдёт.Задача одна на всех: разобрать топ-10 heap alloc_objects

продолжить чтение

Оставлено в

Agent Team в Claude Code: когда одного агента в терминале уже не хватает

Claude Code давно вырос из «чата в терминале». Он читает проект, правит файлы, гоняет тесты, ковыряет логи. Но у обычного режима есть потолок: одна сессия — один контекст и одна линия мыслей. Пока задача простая, это норм. А вот когда надо одновременно посмотреть на безопасность, тесты, производительность и архитектуру — контекст распухает, агент скачет между темами, половина деталей теряется.Для таких случаев есть экспериментальный режим Agent Team. Ниже — что это, как включить и где он правда помогает, а где только мешает.Что это такоеЕсли коротко: вместо одного агента запускается команда.

продолжить чтение

Оставлено в

Xiaomi выпустила MiMo Code — полноценного автономного AI-агента

Источник.Xiaomi выпустила MiMo Code — конкурента не просто моделям, а агентным системам.

продолжить чтение

Оставлено в

Домик для ИИ: как завод пришёл к идее AI ready для бизнеса

Бизнес нацелился делать свой собственный AI. Все задают вопрос: «Какая модель мне нужна?» Но никто не задумывается, на каких мощностях модель будет работать. Мы тоже сначала не задумывались. Разработали корпоративного AI-агента, прокачали ИТ-команду, чтобы двигаться дальше — и споткнулись о «железный порог». Так родилась идея AI ready модуля. В статье рассказали, что это такое и почему AI начинается не с модели, а с инфраструктуры.

продолжить чтение

Оставлено в

Выкатили «запрещенку»: Anthropic открыл публичный доступ к Claude Fable 5

Источник.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

ai-агенты.

Работает ли Caveman? Тестируем модный скилл для экономии токенов

LLM становятся умнее, но есть ценность, до которой они не дотянутся. Где она?

Гайды Anthropic для Fable 5 и Opus 4.8 советуют противоположное, у OpenAI — третий путь. Что менять в промптах

Месяц с LLM Wiki Андрея Карпатого: главная сила LLM — не в пересказе, а в умении «связывать» знания

Не просто чат-бот: как мы встраиваем MCP-агентов в корпоративную платформу SimpleOne

Нужно ли использовать Qwen? Качество и цена

Agent Team в Claude Code: когда одного агента в терминале уже не хватает

Xiaomi выпустила MiMo Code — полноценного автономного AI-агента

Домик для ИИ: как завод пришёл к идее AI ready для бизнеса

Выкатили «запрещенку»: Anthropic открыл публичный доступ к Claude Fable 5

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

ai-агенты.