ВведениеВсем привет! Продолжаю тему предыдущей статьи. В ней сравнивалось железо для локального инференса — Nvidia DGX Spark, Mac Studio M3 Ultra и Strix Halo. И как можно было догадаться, остановился я именно на последнем.Железо есть, зарядим теперь на нем пару-тройку локальных моделей под управлением проверенного AI-агента.Claude Сode по подписке с оригинальными LLM - это, конечно, замечательно. Но это стоит денег, да и свой код в чужие дата-центры не всегда правильно отправлять. Плюс за всякое неосторожное движение можно попасть в бан, рискуя потерять все свои наработки.Одно из решений:

Оставлено в

Xiaomi разогнали 1T-модель до 1200 tok-s на стандартных GPU

Китайские команды MiMo и TileRT опубликовали режим UltraSpeed для модели MiMo V2.5 Pro (1,02T параметров).На одном 8-карточном сервере со стандартными GPU, до ~1200 токенов в секунду. Cerebras выдаёт похожие скорости на кастомном железе. Здесь обошлись без него.

продолжить чтение

Оставлено в

Топ-советы по Claude Code от Бориса Черни и не только: гайд на 56k звёзд — что реально работает, а что мимо

Главный вывод про поиск: «Claude Code выкинул RAG» и «я внедряю Graphify» — не спор, а две половины одного гибрида. Для кода побеждает связка grep + структурный индекс (tree-sitter/AST), а не чистый grep и не чистый вектор.Вектор проиграл коду по делу, а не вообще: точность (символ есть или нет), свежесть (индекс устаревает), чанкинг (кусок ≠ логическая единица). А слабость grep — расход токенов — чинится специализированными search-моделями, не переходом на вектор.Сам создатель Claude Code выбрал agentic search «по ощущениям»

продолжить чтение

Оставлено в

А что мы получим, делегировав разработку ИИ

Всем привет! Я молодой java-лид в одной из "гостех" контор и меня мучает вопрос, или навязчивая мысль "А что мы получим, делегировав разработку ИИ"... Во-первых, мне, скорее всего, страшно за себя любимого, что мое место отберет машина, и что писать код отдадут языковой модели, а я останусь неудел и будут вынужден заниматься какой-то другой, не связанной с IT, или лучше сказать, разработческой деятельностью.

продолжить чтение

Оставлено в

C++101

Про C++ часто шутят, что любую вещь можно сделать пятью разными путями, четыре из которых компилируются, три работают, а два правильные, но один зависит от фазы луны. Часто такие шутки и идиомы откладываются в коллективной памяти сообщества какой именно из этих путей правильный в каждой конкретной ситуации.

продолжить чтение

Оставлено в

Один промпт разросся в регламент: как я разделяю ответственность внутри AI-навыка

У меня был рабочий AI-навык для инженерных задач. Сначала он выглядел как обычная инструкция: роль, задача, формат ответа и несколько ограничений. Этого хватало, пока сценарии были короткими: посмотреть фрагмент кода, подсказать план, разобрать очевидную ошибку.Потом навык начал получать задачи сложнее. Например: “посмотри PR перед merge”. В такой фразе много скрытой работы. Нужно понять, что меняется, какие есть ограничения, где может быть риск, чем подтверждён вывод, какие замечания действительно блокируют принятие изменений, а какие остаются пожеланиями.

продолжить чтение

Оставлено в

Экономный ИИ. 12 способов снизить расходы (токенов-на токены)

Наверное, всем уже очевидно, что ИИ крайне полезен, мир поменялся, нас всех заменят роботы и вообще ИИ уже нас во всём превзошёл :)Всё так или почти так, "но есть одно но" как поётся в одной известной песне. ИИ стоит денег, и весьма немалых при текущих ценах. А про локальные модели для большинства пользователей и компаний в РФ можно забыть. Ну и в целом кажется локальные модели - это не сценарий ИИ будущего.

продолжить чтение

Оставлено в

Искусственный интеллект и будущее человечества

1. Точка переломаМы живём в уникальный момент истории — впервые за несколько миллионов лет эволюции на планете появился не просто новый инструмент, а новый тип интеллекта

продолжить чтение

Оставлено в

Тест Лавлейс: переосмысление

Почему один из самых требовательных тестов ИИ уже, похоже, пройденТест Лавлейс предложили в 2001 году, чтобы закрыть слабые места более известного теста Тьюринга

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

Программирование.

Как двери издеваются над программистами

Claude Code с локальными Qwen3.6 на AMD Strix Halo: полное руководство по настройке

Xiaomi разогнали 1T-модель до 1200 tok-s на стандартных GPU

Топ-советы по Claude Code от Бориса Черни и не только: гайд на 56k звёзд — что реально работает, а что мимо

А что мы получим, делегировав разработку ИИ

C++101

Один промпт разросся в регламент: как я разделяю ответственность внутри AI-навыка

Экономный ИИ. 12 способов снизить расходы (токенов-на токены)

Искусственный интеллект и будущее человечества

Тест Лавлейс: переосмысление

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

Программирование.