llm. - страница 73

llm.

Что нашли внутри Claude, когда заглянули ему в голову

С вами автор канала токены на ветер, и сегодня разберём одно из самых интересных ИИ-исследований последнего времени.Есть такая штука, которая не даёт покоя исследователям ИИ: мы создали системы, которые пишут код, сочиняют стихи, сдают экзамены на врача и юриста — но понятия не имеем, как именно они это делают. Буквально чёрный ящик: данные вошли, ответ вышел, а что между — загадка.

продолжить чтение

Полный текст конституции Anthropic для LLM Claude в переводе на русский

продолжить чтение

Opus 4.6 и команда ИИ-агентов написала компилятор С за 2 недели

Исследователь Anthropic Николас Карлини провёл эксперимент с так называемыми agent teams — группой автономных LLM-агентов, которые работают над одним проектом без постоянного участия человека.В качестве стресс-теста он запустил 16 экземпляров Claude Opus 4.6 и поручил им написать компилятор С на Rust с нуля. Цель была следующей: компилятор должен уметь собирать Linux kernel. После почти 2000 сессий, двух недель работы и затрат около 20 000 долларов агенты выдали

продолжить чтение

Модель находит баг в криптографии, а криптограф узнаёт от неё новую математику

Эта статья — ответ на критику: «перестаньте рассказывать сказки, как AI помогает в науке, покажите примеры!». Действительно, без примеров, рассказы об успешном успехе AI выглядят как сектантский бред.

продолжить чтение

AG-UI. Как написать AI ассистента для подбора подарков за 20 минут

Всем привет! Я Никита, Principal Engineer в стартапе AG2, мейнтейнер одноименного фреймворка для разработки AI агентов (AG2), автор фреймворка FastStream и просто опенсорс и AI энтузиаст.И, как любой разработчик, я иногда запускаю пет-проекты.Один из таких проектов, который я запустил после новогодних праздников - это AI ассистент по подбору подарков (с интегрированным вишлистом) ДарийНа его примере я хочу рассказать о протоколе AG-UI

продолжить чтение

GitHub Copilot CLI: агентный режим и планирование задач

Привет, Хабр! Недавно GitHub выкатил крупное обновление Copilot CLI — инструмент превратился из простого подсказчика команд в полноценного агента с режимом планирования, памятью репозитория и кучей новых возможностей. Разберём, что появилось и как это использовать.Для тех, кто пропустил: что такое Copilot CLIGitHub Copilot CLI — ИИ-ассистент, который живёт прямо в терминале. Работает на Linux, macOS и Windows (через PowerShell или WSL). Умеет отвечать на вопросы, генерировать и отлаживать код, а также взаимодействовать с GitHub: создавать pull request, закрывать issue, анализировать изменения в репозитории, запускать workflows.Запускается командой copilot

продолжить чтение

Cursor AI для ревью ручных тест-кейсов в TestOps

Всем привет! Я один из лидеров стека тестирования в компании «ТехВилл» (в простонародье — Head QA). Моя цель простая: снимать рутину с QA-инженеров с помощью AI-инструментов.

продолжить чтение

Anthropic пообещала, что в Claude никогда не будет рекламы

Anthropic выпустила пост-манифест: реклама в Claude не появится. Ни в виде "спонсорских ссылок", ни в виде скрытых рекомендаций от партнёров.Главный аргумент — разговоры с ИИ это не поисковая строка. Люди делятся личным, обсуждают проблемы со сном, думают вслух о сложном. В компании проанализировали диалоги и увидели, что значительная часть — темы, которые обсуждают с близкими или терапевтом. Впихивать туда рекламу было бы странно и неуместно.

продолжить чтение

Когда лопнет пузырь AI?

«Когда OpenAI обанкротятся, на Сен-Бартелеми будут пить меньше шампанского. Ну а мы — мы хорошо заработаем» © Есть характерный момент в каждом технологическом пузыре.

продолжить чтение

«Героиня прикована к полу, но спускается по лестнице»: разбираем логику ИИ-писателей

Леч Мазур добавил три модели в свой бенчмарк по оценке навыков написания коротких рассказов. Kimi K2.5 — 8,07 балла, Qwen3 Max — 7,84, MiniMax-M2.1 — 7,78. Результаты неплохие, но самое ценное в этом бенчмарке — не цифры, а разбор конкретных ошибок.Если вы используете ИИ для текстов, вот на что стоит обращать внимание при проверке.Физическая непрерывность. Героиня «прикована к полу кандалами», через абзац спускается по лестнице, а цепь «остаётся наверху». Модели хорошо держат локальный контекст, но теряют детали на длинной дистанции.

продолжить чтение