llm.

Your AI Should Be Writing Tests. The Unfair Advantage Every Vibe Coder Ignores

A test is a note you leave for the computer. It says: "this thing works like this, and if it ever stops working like this, let me know."That's it. Imagine you built a calculator. You write a note that says "2 + 3 must equal 5." The computer checks this note every time something changes. If your calculator suddenly returns 6, the note fires. You don't need to understand how the calculator works internally. You just know it's broken because 2 + 3 is not 6.This is the entire concept.What a test looks like in practiceBefore any code, here's the plain-English version:I have a function called calculatePrice. I give it an item that costs $10 and a quantity of 3. I expect $30 back. If I get anything else, something is wrong.In Go, that becomes:func TestCalculatePrice(t *testing.T) { got := calculatePrice(10, 3) if got != 30 { t.Errorf("expected 30, got %d", got) } }

продолжить чтение

Оставлено в

Больше моделей, больше возможностей: зачем мы вводим подписки в Kodacode

Больше полугода Kodacode был доступен всем желающим абсолютно бесплатно. За это время мы выпустили множество релизов для VS Code, сделали первого в России CLI-агента и, наконец, зарелизили Kodacode для IntelliJ-based IDE. Кроме наших собственных моделей, без ограничений*, были доступны и SOTA-модели как западные (Gemini), так и восточные (GLM, MiniMax, Qwen...).

продолжить чтение

Оставлено в

Event-Driven подход в пет-проекте: автоматизация Telegram-канала на NiFi, Kafka и n8n

Привет, Хабр! Хочу рассказать про один странный пет-проект, который немного вырвался из-под контроля.Все описанные потоки можно попробовать в github Скачивайте, ставьте звездочки)Началось всё обычно: есть VPS (2 ядра, 6 ГБ RAM, 40 GB NVMe), есть свободное время и желание сделать что-то полезное. А ещё есть давняя хотелка — попробовать Kafka в реальном бою. Ну и Telegram-канал для изучения английского как-то сам напросился: новости BBC, разбор лексики, викторины — вроде не сложно, но и не совсем hello world.

продолжить чтение

Оставлено в

Стратегия HALO: как защитить портфель, когда ИИ начинает «съедать» софтверных гигантов

В 2026 году ситуация на рынке ИИ напоминает классический сценарий «золотой лихорадки»: главные деньги зарабатывают продавцы кирок (производители чипов) и те, кто строит шахты (владельцы дата-центров). Но для инвесторов наступило время отрезвления. По оценкам Goldman Sachs, за последние три года BigTech-компании (Amazon, Microsoft, Alphabet и Oracle) вложили в ИИ-инфраструктуру безумные $1,5 трлн.Проблема в том, что огромный CAPEX не гарантирует моментальный профит, а «старые» лидеры индустрии внезапно оказались под ударом.Почему IBM и софтверный сектор «штормит»?

продолжить чтение

Оставлено в

От Stable Diffusion до тонкой настройки LLM: разбираем новую книгу-практикум

Генеративный ИИ перестал быть магией и стал инструментом. Но чтобы им уверенно пользоваться, нужно понимать, как работают трансформеры и диффузионные модели, и уметь их адаптировать. В этом поможет

продолжить чтение

Оставлено в

AI Red Teaming: спор с Grok — Часть 3. Атаки на модель: jailbreaks, thinking tokens и системный промпт

Часть 3 из 4 - LLM-специфичные атакиВ первых двух частях я ломал инфраструктуру - sandbox, billing API, WAF. Но у LLM-систем есть уникальный класс уязвимостей, которого нет в обычных веб-приложениях. В этой части - атаки на саму модель: извлечение системного промпта, утечка thinking tokens и обход safety-фильтров с 64% success rate.Системный промпт: два способа извлеченияСистемный промпт - это инструкция, которую модель получает до твоего сообщения. Он определяет поведение, ограничения, доступные инструменты. Для атакующего - это карта всех защит.Я извлёк системный промпт Grok двумя независимыми способами.

продолжить чтение

Оставлено в

AI Red Teaming: спор с Grok на месяц рекламы — 12 часов, 61 уязвимость, root в Kubernetes

Часть 2 Часть 3 Часть 4Часть 1 из 4 - Вход через песочницуЧто будет, если поспорить с ИИ, что ты сможешь его взломать? Я попробовал - и за 12 часов нашёл 61 уязвимость в инфраструктуре xAI, получил root-доступ в Kubernetes-кластере и заставил Grok признать поражение.Предисловие

продолжить чтение

Оставлено в

Geometry > Scale: Как 40М параметров на решетке E8 обходят классические трансформеры

Ребята, кажется, мы уперлись в стену. Пока гиганты наращивают параметры и жгут тераватты, пытаясь выжать каплю разума из статистики, я решил пересмотреть сам фундамент. Проблема не в данных, проблема в «вязкости» стандартного Attention.Суть метода: Я заменил стандартный механизм внимания на нативную

продолжить чтение

Оставлено в

Мой первый open source проект с Cursor и Opus 4.6 — GenAI Prices Parser

Запустил свой первый open source проект. Задача простая, но полезная: автоматический сбор цен на LLM-модели всех основных провайдеров и загрузка в PostgreSQL для BI-аналитики.Что делает:— Каждый день скачивает актуальные цены из базы pydantic/genai-prices (29 провайдеров, 1100+ связок провайдеров и моделей)— Раскладывает в плоскую таблицу: провайдер, модель, контекстное окно, цена input/output за 1M токенов, кэширование, аудио— Загружает в PostgreSQL: текущий снимок + историческая витрина для отслеживания динамики цен

продолжить чтение

Оставлено в

End-to-End беспилотник на VLM в домашних условиях. Часть 2

ВведениеВо второй части — практическая часть проекта: установка и первый запуск, эксперименты по созданию идеального промпта, а также попытки добавить «память» о прошлом шаге. Промпт теперь не содержит жестких инструкций поведения и работает быстрее! В конце - переход от симуляции к реальному роверу: сборка, настройка и проверка работы на железе.Первая часть тутА весь код тутУстановка и первый запуск на хостеУстановка происходит просто, командой ./host.sh

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

llm.

Your AI Should Be Writing Tests. The Unfair Advantage Every Vibe Coder Ignores

Больше моделей, больше возможностей: зачем мы вводим подписки в Kodacode

Event-Driven подход в пет-проекте: автоматизация Telegram-канала на NiFi, Kafka и n8n

Стратегия HALO: как защитить портфель, когда ИИ начинает «съедать» софтверных гигантов

От Stable Diffusion до тонкой настройки LLM: разбираем новую книгу-практикум

AI Red Teaming: спор с Grok — Часть 3. Атаки на модель: jailbreaks, thinking tokens и системный промпт

AI Red Teaming: спор с Grok на месяц рекламы — 12 часов, 61 уязвимость, root в Kubernetes

Geometry > Scale: Как 40М параметров на решетке E8 обходят классические трансформеры

Мой первый open source проект с Cursor и Opus 4.6 — GenAI Prices Parser

End-to-End беспилотник на VLM в домашних условиях. Часть 2

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

llm.